[筆記] 超新手也能用 Python 爬蟲打造貨比千家的比價網站 – 資料科學與網頁爬蟲

章節連結

斷斷續續地在網路和書籍上學習有關 Python 的爬蟲技術,但隨著反爬蟲的技術也是越來越精進,所以想說藉由 「超新手也能用 Python 爬蟲打造貨比千家的比價網站」這門課來看看能否解決相關的疑惑。這篇主要是記錄下「資料科學與網頁爬蟲」的簡介。
python


課程相關資訊

[連結]:https://hiskio.com/courses/527/lectures/26078

本篇範圍:Chapter 1 ( 資料科學與網頁爬蟲 )

請注意:本系列文章為個人對應課程的消化吸收後,所整理出來的內容。換言之,並不一定會包含全部的課程內容,也有可能會添加其他資源來說明。


筆記

1. 資料科學,是從數據中提取有價值的部分來生出產品。過往的統計學、應用數學、機器學習…等,都可以應用於此。簡言之,就是找尋資料中的關係。
2. 網頁爬蟲 = 用程式自動化的收集來自於網頁中的資料
3. 取得資料→資料前處理→模型訓練→模型評估→決策應用 ( 找資料→收集→整理→儲存 )
4. 伺服器端 ( 請求 Request / 回應 Response )
5. 資料來源:檔案 ( 靜態 )、API ( 動態 )、網頁 ( 被動的資料公開 )


系列文章

  • [筆記] 超新手也能用 Python 爬蟲打造貨比千家的比價網站 – 網頁爬蟲的起源和處理策略
  • [筆記] 超新手也能用 Python 爬蟲打造貨比千家的比價網站 – 從網頁溝通架構到爬蟲運作原理
  • [筆記] 超新手也能用 Python 爬蟲打造貨比千家的比價網站 – 利用 Requests 模擬請求和攔截回應
  • [筆記] 超新手也能用 Python 爬蟲打造貨比千家的比價網站 – 利用 BeautifulSoup 來解析網頁原始碼
  • [筆記] 超新手也能用 Python 爬蟲打造貨比千家的比價網站 – Python 與爬蟲環境準備
  • [筆記] 超新手也能用 Python 爬蟲打造貨比千家的比價網站 – Python 的基本語法
  • 按讚加入粉絲團

    延伸閱讀