이전 게시물에서 Twitter (twitteR), Yahoo Finance (quantmod), The Guardian (guardianR) 및 OECD (oecd R-package)에서 데이터를 검색하고 사용하는 방법을 보여주었습니다. 이 게시물에서는 사용 가능한 R- 패키지 fredr을 사용하여 API 키로 FRED 데이터에 액세스하는 방법을 보여줍니다. fredr 패키지를 시작하기위한 좋은 문서도 저자들에 의해 출판되었습니다 : http://sboysel.github.io/fredr/articles/fredr.html
미국 국산차 생산과 수입차 판매를 예로 들어 FRED 시계열 데이터에 대한 데이터 검색 프로세스를 보여줍니다.
첫 번째 단계는 R 스크립트에서 FRED API 키를 설정하는 것입니다. 이를 위해 FRED에 등록하고 API 키를 복사하여 붙여 넣어야합니다. 여기에서 할 수 있습니다 : https://research.stlouisfed.org/useraccount/apikey
# CRAN에서 직접 fredr 패키지 설치
#install.packages("fredr")
# 패키지로드
library(fredr)
## Warning: package 'fredr' was built under R version 3.6.2
# fredr API 키 설정
fredr_set_key(api_key) # api_key 문자열을 검색해야합니다. https://research.stlouisfed.org/useraccount/apikey
fredr_set_key 함수를 사용하여 FRED API 키가 설정되면 fredr_series_search_text 함수는 FRED 데이터베이스에서 시계열 검색을 활성화합니다.
# 자동차 생산 시리즈 검색 데이터베이스
search_ls <- fredr_series_search_text("car production")
# 시리즈 검색 결과 목록의 열 이름보기
colnames(search_ls)
## [1] "id" "realtime_start"
## [3] "realtime_end" "title"
## [5] "observation_start" "observation_end"
## [7] "frequency" "frequency_short"
## [9] "units" "units_short"
## [11] "seasonal_adjustment" "seasonal_adjustment_short"
## [13] "last_updated" "popularity"
## [15] "group_popularity" "notes"
fredr_series_search_text 함수는 검색 결과를 요약 한 목록을 반환하여 관련 ID 및 중요한 데이터 세트 특성 (예 : 계절 조정.
fredr_series_observations를 사용하면 관련 시리즈 ID를 지정하여 원하는 시계열 데이터를 검색 할 수 있습니다. do.call 함수를 사용하면 반환 된 시계열 목록을 ggplot2에서 플로팅 할 수있는 데이터 프레임으로 변환 할 수 있습니다.
# ggplot2 R- 패키지로드
library(ggplot2)
# DAUPSA는 계절별로 조정 된 월간 국산차 생산량을위한 id입니다.
series_ls <-fredr_series_observations(series_id = "DAUPSA")
# 시리즈 목록을 데이터 프레임으로 변환
series_df <- do.call(cbind.data.frame, series_ls)
# 데이터 플로팅
ggplot(series_df) + geom_line(mapping = aes(x=date,y=value),
color = "red") +
ggtitle("Monthly US car production, seasonally adjusted [in thousands]") +
xlab("time") +
ylab("monthly cars produced [thousands of units]")
위 차트는 1993 년 이후 미국 국내 자동차 생산량을 요약 한 것입니다 (월별 수치, 계절에 따라 조정 됨). 보시다시피 역사적 생산량은 감소했습니다.
하지만 신차 수입은 어떻습니까? 아래에서는 분기별로보고되고 계절별로 조정 된 10 억 달러의 수입 신차 판매에 대한 위의 작업 흐름을 반복합니다.
# B149RC1Q027SBEA는 계절에 따라 조정 된 수십억 달러의 미국 내 수입 신차 판매 ID입니다.
series_df <-do.call(cbind.data.frame,
fredr_series_observations(series_id = "B149RC1Q027SBEA"))
# 데이터 플로팅
ggplot(series_df) + geom_line(mapping = aes(x=date,y=value),
color = "red") +
ggtitle("Quarterly US imported new car sales, seasonally adjusted [in billion USD]") +
xlab("time") +
ylab("quarterly new imported car sales [billion USD]")
최적화 및 시뮬레이션을 전문으로하는 산업 엔지니어 (R, Python, SQL, VBA)
Leave a Reply