如何用 R 一次下載所有台股的歷史股價?
以下為 quantmod 下載股價的基本指令:
- > library(quantmod) # 開啟套件
- > getSymbols("YHOO", from = "2016-04-01", to = "2016-04-29", src="google") # 用 getSymbols() 輸入"股票代碼""日期""資料庫來源"
複製代碼
要用 quantmod 下載股價首先必須要知道台股的代碼,若沒指定資料庫 quantmod 內建的設定是 yahoo finance,因此台股的代碼必須符合 yahoo finance 的格式,像台股代碼 3266 在 yahoo finance 是 3266.TW。先用從公開資訊觀測站下載的財報資料,代碼欄位進行字串編輯,再另外指定代碼欄位的變數,放入 getSymbols():
- > library(quantmod)
- > m_data_20160411 <- read.table("Desktop/R/m_data_20160411.csv", header=TRUE, sep=",") #匯入 CSV 財報檔
- > name <- paste(m_data_20160411[,1],"TW", sep = ".") #依據財報檔的代碼欄位新增 .TW 於字串中,並指定為變數 "name"
- > getSymbols(name, from = "2016-04-27", to = "2016-04-27", src="yahoo")
複製代碼
這個方式初步成功了,也產生了每支股票在指定日期內的所有資料,開盤價 Op、收盤價 Cl、最高價 Hi、最低價 Lo、成交量 Vo、均價 Ad 六個欄位的 data frame。
| 1101.TW於2016-04-27這天的成交資料 | 然而這個方法有一個很大的問題,就是如果 yahoo finance 或其他資料庫某幾支股票有一些問題無法下載時便會停止,查找後發現有 4 支股票的資料無法下載。為了這個問題在網路上找了很久,試過各種方式後來選擇用 loop 的方式解決 :
> dataset<- xts() #設置一個xts資料框架
以下為 loop 的寫法:- for(i in 1:length(name)) {
- name[i]-> symbol
- tryit <- try(getSymbols(symbol,from="2016-04-27", src='yahoo'))# specify the "from" date to desired start date
- if(inherits(tryit, "try-error")){
- i <- i+1
- } else {
- data <- getSymbols(symbol, from="2016-04-27", src='yahoo')# specify the "from" date to desired start date
- dataset <- merge(dataset, Cl(get(name[i])))#將所有股票的收盤價 Cl 合併成一個 data frame
- rm(symbol)
- }
- }
複製代碼 從指令可以看出是要電腦依據股票代碼,一個個到資料庫抓取資料,try() 的用法,然後用 if else 設條件,如果資料抓取失敗就跳到下一個股票,最後將所有股票的收盤價 Cl 合併成一個 data frame。
| 跑出一個很長的 data frame 總共找出 824 支股票(行)在 2016-04-27(列)的收盤價,
由此只要在設定期間內,每日的股價都可以下載 | 最後將股價資料合併至一開始匯入的財報檔:- > myDF <- as.data.frame(as.matrix(dataset))#將dataset轉換為data frame
- > namex2 <- substr(name, start = 1, stop = 4)#先將股票代碼統一成m_data_20160411"公司代號"格式
- > newrow = namex2
- > datasetSS = rbind(myDF,newrow)#將股票代碼新增1列至myDF中
- > datasetT <- t(datasetSS)#轉置datasetSS
- > colnames(datasetT)[colnames(datasetT)=="2"] <- "公司代號" #更改datasetT股票代碼的欄位名稱
- > m_data <- merge.data.frame(m_data_20160411,datasetT,by="公司代號",all=TRUE) #依照"公司代號"合併資料
- > colnames(m_data)[colnames(m_data)=="2016-04-27 08:00:00"] <- "price.close" #更改欄位名稱為"price.close"
- > write.table(m_data, file = "Desktop/R/m_data.csv", sep = ",")#將結果匯出成csv檔
複製代碼
|