這回記錄下如何運用 Python 內建的 requests 函式庫抓取網頁資料,並運用 Pandas 來解析。
課程名稱
用 Python 理財:打造小資族選股策略:https://bit.ly/2KXR1Nw
對於初學者而言,算是簡易的入門教材。由於 Python 本身的語言特性,相較於 JavaScript 是比較人性化的。外加上已內建不少好用的函式庫,對於資料分析的處理上,用 Python 入門算是滿不錯的。
課程相關文章
指令
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
# encoding: utf-8 import requests import pandas as pd # 抓取網頁 res = requests.get('http://www.wibibi.com/info.php?tid=116') res.encoding = 'utf-8' # 網頁編碼指定 # 網頁存檔 f = open('./python_learn/text.html', 'w') f.write(res.text) f.close() # 讀取檔案轉成 DataFrame dfs = pd.read_html('./python_learn/text.html') for i in range(0, 5): print(dfs[i]) |