PHP爬蟲程式設計

課程創作:陳世明

課程適合地區:全球

課程影片總長度: 2.2小時

上架日期:2017-08-14

學員評價:

NT 2,000
購買後30天內不滿意退費 退費政策

課程介紹

爬蟲 (crawler) 也被稱為蜘蛛 (spider),是用來自動爬取資料的網路機器人, 如果把整個網際網路想像成一張大網,爬蟲的工作就是在網路上爬來爬去獲取 它想要的獵物,至於誰是獵物,那就看設計程式的你如何設定囉。

網路機器人看到的網頁和我們人類眼睛看到的不一樣,在網路機器人的世界裡只有原始碼,靠的是演算法和邏輯來擷取網站裡的資訊,不管是文字內容、連 結或圖片都難不倒它。

我們每天都會使用的「Google 搜尋」就是一個最經典爬蟲實例,只要鍵入關 鍵字,Google 的巨大爬蟲就可以幫我們把網路上所有的相關資訊都找出來, 又比如時下盛行的比價網站,也是非常典型的爬蟲應用範例。

時間就是金錢,在資訊爆炸的時代,搜集資料已經成為一項費時費力的工作, 這個時候就需要爬蟲程式來幫助我們自動化地做好搜集工作,除了絕不會有漏 網之魚,還能解放最寶貴的時間和複製貼上鍵!

起手式
  1. 基本概念
  2. 網頁資訊擷取與輸出

老師將講解HTML的架構以及重要的各類型Tags,有了基礎觀念後再示範如何 使用API HTML DOM Parser擷取網頁內容

爬蟲程式
  1. DOM 擷取網頁資訊的方法

以《方言》中國哲學書電子化計劃網站為例,老師將帶領學員一步步實際操作 、演練

php 陣列操作運用
  1. 擷取網站的連結資料,存放在程式的陣列
  2. 程式輸出 html 操作細節教學
爬蟲程式與 MySQL 資料庫操作
  1. 介紹如何建立 MySQL 資料庫
  2. 如何將擷取資料存放在 MySQL 資料庫
建立 MySQL 查詢系統
  1. 撰寫 html 網頁
  2. 撰寫《方言》資料庫查詢程式,採用超連結顯示資料庫內容
  3. 採用 < table > 輸出檢索的畫面
  4. 透過 CSS 進行輸出畫面的細部調整
撰寫資料庫檢索系統
  1. 撰寫 html 網頁
  2. 撰寫《方言》資料庫檢索程式
  3. 採用 < table > 輸出檢索的畫面
檢索系統的優化
  1. 將檢索系統輸出進行優化
  2. 運用 html 表格輸出
  3. 表格內容與邊框插空白的設定
  4. 透過 CSS 進行輸出畫面的細部調整
法拍屋查詢系統
  1. 運用前面建立的 html, dom, php 等資訊技術,實作如何擷取法拍屋資訊
  2. 法拍屋分頁擷取的部分,留作學員練習之用

學員上課後會學到什麼或能做什麼

1. 了解爬蟲程式的商業運用
2. 運用 DOM 完成不可能的任務
3. 如何擷取別人網站中有用的資訊
4. 查取的資料怎麼存入資料庫
5. 從抓取的資料,製作一個全新功能的資料庫網頁

學員上課前需具備哪些軟、硬體設備或常識

1. 熟悉 CSS, HTML, PHP, MySQL
2. 熟悉 PHP 程式設計
3. 安裝 Apache, PHP, MySQL 等軟體(免費)
4. 安裝 Brackets 文字編輯器(免費)
5. Windows/Mac OS X 等系統均可

課程適合對象

1. 想進一步了解,網站程式設計還能做什麼
2. 充實精進自己的網路專業技術
3. 不用購買資訊源,網路資訊一把抓
4. 了解如何與防火牆對抗的資訊技術
5. 提點您,運用網路資訊創業的點子

老師介紹

陳世明博士
著作:臺語漢字學
經歷:
臺灣金融研訓院特約講師
彰化縣文化資產學會講師
嶺東、環球科大兼任講師
亞大、修平科大業界導師
亞太銀行資訊室
華豐橡膠(股)公司程式設計師
倚天資訊

課程評語與問答