naokazuterada
3/13/2016 - 9:04 AM

Pandasを使って、簡単にウェブ上のテーブルデータを取得

Pandasを使って、簡単にウェブ上のテーブルデータを取得

# if pandas not installed
# pip install pandas

import pandas as pd

url = 'http://passo2.com/ph_j.htm'
dframe_list = pd.io.html.read_html(url)
# ページ内に複数のテーブルがある場合があるのでリストで返ってくる。

# 出力結果はPandasのDataFrame形式
# 1つ目のテーブル
dframe_list[0]
# 2つ目のテーブル
dframe_list[1]