斷斷續續地在網路和書籍上學習有關 Python 的爬蟲技術,但隨著反爬蟲的技術也是越來越精進,所以想說藉由 「超新手也能用 Python 爬蟲打造貨比千家的比價網站」這門課來看看能否解決相關的疑惑。這篇主要是記錄下「網頁爬蟲時會需要用的 Python 基本語法」。
課程相關資訊
[連結]:https://hiskio.com/courses/527/lectures/26082
本篇範圍:Chapter 1 ( 資料科學與網頁爬蟲 )
請注意:本系列文章為個人對應課程的消化吸收後,所整理出來的內容。換言之,並不一定會包含全部的課程內容,也有可能會添加其他資源來說明。
筆記
1. 變數會包含「變數名稱」和「變數型態」- Numeric type ( int / float )、String ( str ) 、Boolean ( bool )
2. 各種運算子
3. 字串值會有索引 ( index ),以 [] 來宣告陣列、取值、賦值,以 len() 來取得長度
4. 另外還有不同的容器。 List – 可改變的序列、tuple – 不可改變的序列、dict 可改變的 key-value 映射元素集合、set 可改變且為容器內的值都是獨一無二的
5. 流程控制 if-else, while, for-in…等
6. function 函式用於程式碼的重複使用,會關注兩點:回傳的結果是什麼、會不會改變物件本身。
7. 載入套件 Import Library / Module / Package,同時有兩種引入方法:
import package // 引入全部套件,到時候用 key 去取裡面的方法,如 package.defA
from defA import package // 將 defA 方法自 package 引入進來
8. python 是有一系列的 built-in 函式的