Python에서 Quandl의 데이터를 쿼리하는 방법에 대한 빠른 게시물입니다. Quandl은 명령 프롬프트에서 “pip install”명령으로 설치할 수 있습니다. 이를 위해 Anaconda 명령 프롬프트에 “pip install quandl”을 입력하면됩니다.
Quandl은 데이터의 Wikipedia입니다. 단지 모든 콘텐츠가 무료는 아닙니다. Quandl은 미국 연방 준비 은행, 증권 거래소 등과 같은 데이터 공급자로부터 플랫폼으로 전달되는 무료 및 프리미엄 데이터 세트를 유지합니다.
Quandl 웹 사이트에서 계정을 설정해야합니다. 계정을 확인한 후 API 키를 받게됩니다. 이 키로 만 Python에서 quandl 모듈을 사용할 수 있습니다.
아래 코드에서 quandl을 통해 Deutsche Bundesbank에서 제공 한 독일 자동차 산업 생산 출력에 대한 데이터 세트를 검색합니다.
import quandl # API 키 설정 quandl.ApiConfig.api_key = "your key here" import numpy import pandas # quandl에서 numpy 형식으로 데이터를 검색 한 다음 pandas DataFrame으로 변환 data = pandas.DataFrame(quandl.get("BUNDESBANK/BBDE1_M_DE_Y_BAA1_A2R290050_G_C_I10_A", returns="numpy"))
데이터를 pandas DataFrame 형식의 시계열로 검색했습니다. matplotlib를 사용하여 시계열을 플로팅합니다.
import matplotlib.pyplot as plt plt.figure(figsize=(10,10)) plt.plot(data["Date"], data["Value"],color="red") plt.title("Manufactur output for motor vehicles, trailers, semi-trailers and other transport equipment; Germany",size=12) plt.ylabel("index value",size = 12) plt.xlabel("date", size =12)
Text(0.5, 0, 'date')
이 경우 데이터 세트가 더 이상 유지되지 않는다는 점에 유의해야합니다. 이는 데이터 세트의 꼬리를 볼 때 분명해집니다.
data.tail()
Date | Value | |
---|---|---|
319 | 2017-08-31 | 138.8 |
320 | 2017-09-30 | 130.1 |
321 | 2017-10-31 | 124.3 |
322 | 2017-11-30 | 136.3 |
323 | 2017-12-31 | 132.6 |
모든 데이터 세트가 유지되는 것은 아니며 모든 데이터 세트가 잘 문서화되어 있지는 않습니다. 여전히 Quandl은 관련 데이터 세트를 쿼리하기위한 강력한 검색 엔진입니다.
최적화 및 시뮬레이션을 전문으로하는 산업 엔지니어 (R, Python, SQL, VBA)
Leave a Reply