[Python] 抓取證券編碼一覽表

admin · 發表於 2018-2-25 02:10:43

使用 Python3 結合 Requests 與 BeautifulSoup 套件進行截取 url = "http://isin.twse.com.tw/isin/C_public.jsp?strMode=1" 本國未上市，未上櫃公開發行證券，國際證券辨識號碼一覽表http://isin.twse.com.tw/isin/C_public.jsp?strMode=1
本國上市證券國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=2
本國上市債券，上櫃債券，國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=3
本國上櫃證券國際證券辨識號碼一覽表http://isin.twse.com.tw/isin/C_public.jsp?strMode=4
本國興櫃證券國際證券辨識號碼一覽表http://isin.twse.com.tw/isin/C_public.jsp?strMode=5
本國期貨及選擇權國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=6
本國開放式證券投資信託基金，國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=7
本國未公開發行之創櫃板證券國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=8
登錄買賣黃金現貨國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=9

import requests
from bs4 import BeautifulSoup
def getList():
url = "http://isin.twse.com.tw/isin/C_public.jsp?strMode=2"
res = requests.get(url, verify=False)
soup = BeautifulSoup(res.text, 'html.parser')
table = soup.find("table", {"class": "h4"})
c = 0
for row in table.find_all("tr"):
data = []
for col in row.find_all('td'):
col.attrs = {}
data.append(col.text.strip().replace('\u3000', ''))
if len(data) == 1:
pass # title 股票, 上市認購(售)權證, ...
else:
print(data)
getList()

複製代碼

['有價證券代號及名稱', '國際證券辨識號碼(ISIN Code)', '上市日', '市場別', '產業別', 'CFICode', '備註']
['1101台泥', 'TW0001101004', '1962/02/09', '上市', '水泥工業', 'ESVUFR', '']
['1102亞泥', 'TW0001102002', '1962/06/08', '上市', '水泥工業', 'ESVUFR', '']

...

		自動登錄	找回密碼
密碼			立即註冊