Um post rápido sobre como consultar dados do Quandl em Python. O Quandl pode ser instalado com o comando “pip install” em seu prompt de comando. Para isso, basta digitar “pip install quandl ” no prompt de comando do Anaconda.
Quandl é a Wikipédia dos dados – só que nem todo o seu conteúdo é gratuito. Quandl mantém conjuntos de dados gratuitos e premium que são encaminhados para a plataforma de provedores de dados, como o Federal Reserve dos EUA, bolsas de valores, etc.
Você tem que configurar uma conta no site da Quandl. Depois de confirmar sua conta, você receberá sua chave API. Somente com esta chave você pode usar o módulo quandl em Python.
No código abaixo, recupero um conjunto de dados sobre a produção da indústria automotiva alemã, fornecido pelo Deutsche Bundesbank via quandl
import quandl
# configurando chave de API
quandl.ApiConfig.api_key = "sua chave aqui"
import numpy
import pandas
# recuperando dados do quandl no formato numpy e, em seguida, convertendo em pandas DataFrame
dados = pandas.DataFrame(quandl.get("BUNDESBANK/BBDE1_M_DE_Y_BAA1_A2R290050_G_C_I10_A", retorna=" numpy "))
Recuperei os dados como uma série temporal no formato pandas DataFrame; Eu ploto a série temporal usando matplotlib
import matplotlib .pyplot como plt
plt.figure(figsize=(10,10))
plt.plot(dados["Data"], dados["Valor"],cor="vermelho")
plt.title("Saída do fabricante para veículos motorizados, reboques, semi-reboques e outros equipamentos de transporte; Alemanha",size=12)
plt.ylabel("valor do índice",tamanho = 12)
plt.xlabel("data", tamanho =12)
Text(0.5, 0, 'data')
Nesse caso, deve-se observar que o conjunto de dados não é mais mantido. Isso fica claro ao visualizar a cauda do conjunto de dados:
data.tail()
Encontro | Valor | |
---|---|---|
319 | 31-08-2017 | 138,8 |
320 | 30/09/2017 | 130.1 |
321 | 31/10/2017 | 124.3 |
322 | 30/11/2017 | 136,3 |
323 | 31/12/2017 | 132,6 |
Nem todos os conjuntos de dados são mantidos e nem todos os conjuntos de dados são bem documentados. Ainda assim, o Quandl é um poderoso mecanismo de pesquisa para consultar conjuntos de dados relevantes.
Cientista de dados com foco em simulação, otimização e modelagem em R, SQL, VBA e Python
Leave a Reply