Una publicación rápida sobre cómo consultar datos de Quandl en Python. Quandl se puede instalar con el comando «pip install» en el símbolo del sistema. Para esto, simplemente escriba «pip install quandl» en el símbolo del sistema de Anaconda.
Quandl es la Wikipedia de los datos, solo que no todo su contenido es gratuito. Quandl mantiene conjuntos de datos gratuitos y premium que se envían a la plataforma desde proveedores de datos como la Reserva Federal de EE. UU., Bolsas de valores, etc.
Tienes que configurar una cuenta en el sitio web de Quandl. Después de haber confirmado su cuenta, recibirá su clave API. Solo con esta clave puede usar el módulo quandl en Python.
En el siguiente código, recupero un conjunto de datos sobre la producción de la industria automotriz alemana, proporcionado por Deutsche Bundesbank a través de quandl
import quandl # configurando la clave API quandl.ApiConfig.api_key = "your key here" import numpy import pandas # recuperando datos de quandl en formato numpy, luego convirtiéndolos en pandas DataFrame data = pandas.DataFrame(quandl.get("BUNDESBANK/BBDE1_M_DE_Y_BAA1_A2R290050_G_C_I10_A", returns="numpy"))
Recuperé los datos como una serie de tiempo en formato pandas DataFrame; Trazo la serie de tiempo usando matplotlib
import matplotlib.pyplot as plt plt.figure(figsize=(10,10)) plt.plot(data["Date"], data["Value"],color="red") plt.title("Manufactur output for motor vehicles, trailers, semi-trailers and other transport equipment; Germany",size=12) plt.ylabel("index value",size = 12) plt.xlabel("date", size =12)
Text(0.5, 0, 'date')
En este caso, debe tenerse en cuenta que el conjunto de datos ya no se mantiene. Esto queda claro al ver la cola del conjunto de datos:
data.tail()
Fecha | Valor | |
---|---|---|
319 | 2017-08-31 | 138.8 |
320 | 2017-09-30 | 130.1 |
321 | 2017-10-31 | 124.3 |
322 | 2017-11-30 | 136.3 |
323 | 2017-12-31 | 132.6 |
No todos los conjuntos de datos se mantienen y no todos los conjuntos de datos están bien documentados. Aún así, Quandl es un potente motor de búsqueda para consultar conjuntos de datos relevantes.
Ingeniero industrial especializado en optimización y simulación (R, Python, SQL, VBA)
Leave a Reply