使用 Python3 結合 Requests 與 BeautifulSoup 套件進行截取 url = "http://isin.twse.com.tw/isin/C_public.jsp?strMode=1" 本國未上市,未上櫃公開發行證券,國際證券辨識號碼一覽表http://isin.twse.com.tw/isin/C_public.jsp?strMode=1
本國上市證券國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=2
本國上市債券,上櫃債券,國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=3
本國上櫃證券國際證券辨識號碼一覽表http://isin.twse.com.tw/isin/C_public.jsp?strMode=4
本國興櫃證券國際證券辨識號碼一覽表http://isin.twse.com.tw/isin/C_public.jsp?strMode=5
本國期貨及選擇權國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=6
本國開放式證券投資信託基金,國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=7
本國未公開發行之創櫃板證券國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=8
登錄買賣黃金現貨國際證券辨識號碼一覽表
http://isin.twse.com.tw/isin/C_public.jsp?strMode=9
- import requests
- from bs4 import BeautifulSoup
- def getList():
- url = "http://isin.twse.com.tw/isin/C_public.jsp?strMode=2"
- res = requests.get(url, verify=False)
- soup = BeautifulSoup(res.text, 'html.parser')
- table = soup.find("table", {"class": "h4"})
- c = 0
- for row in table.find_all("tr"):
- data = []
- for col in row.find_all('td'):
- col.attrs = {}
- data.append(col.text.strip().replace('\u3000', ''))
- if len(data) == 1:
- pass # title 股票, 上市認購(售)權證, ...
- else:
- print(data)
- getList()
複製代碼 ['有價證券代號及名稱', '國際證券辨識號碼(ISIN Code)', '上市日', '市場別', '產業別', 'CFICode', '備註']
['1101台泥', 'TW0001101004', '1962/02/09', '上市', '水泥工業', 'ESVUFR', '']
['1102亞泥', 'TW0001102002', '1962/06/08', '上市', '水泥工業', 'ESVUFR', '']
...
|