斷斷續續地在網路和書籍上學習有關 Python 的爬蟲技術,但隨著反爬蟲的技術也是越來越精進,所以想說藉由 「超新手也能用 Python 爬蟲打造貨比千家的比價網站」這門課來看看能否解決相關的疑惑。這篇筆記 Selenium 的套件使用和環境設置。
課程相關資訊
[連結]:https://hiskio.com/courses/527/lectures/27142
本篇範圍:Chapter 3 ( 由前端 JavaScript 產生的資料,動態網站爬蟲實現 )
請注意:本系列文章為個人對應課程的消化吸收後,所整理出來的內容。換言之,並不一定會包含全部的課程內容,也有可能會添加其他資源來說明。
筆記
1. 影片中是使用 Jupyter Notebook,但我採用 python3 + venv + Git bash 在 windows 上進行操作
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
# Prerequisites # 1. download the latest version of python3 # 2. use the following scripts to create a virtual env # python -m venv <folder_name> # 3. Enter the virtual env # source <folder_name>/Scripts/activate import selenium # print selenium version print(selenium.__version__) # load web-driver from selenium import webdriver browser = webdriver.Chrome(executable_path='./chromedriver') browser.get("https://hiskio.com/fundraising/527/about") print(browser.page_source) # quit browser browser.quit() |
參考資料
1. 12. 虛擬環境與套件
2. Activate virtual environment in windows using Git-Bash [duplicate]