Introdução ao Seaborn em Python

Este post é uma introdução aproximada ao módulo Seaborn em Python. Eu o uso para visualização de dados, em combinação com o Pandas. Leia os comentários para entender meu fluxo de trabalho. Qualquer dúvida pode deixar como comentário no final do post.

# pandas é um módulo python para trabalhar com quadros de dados 
import pandas 
# seaborn é um wrapper para matplotlib e serve para visualização de dados 
import seaborn 
# pandas e numpy estão relacionados, portanto eu sempre leio em numpy ao trabalhar com pandas 
import numpy 
# e desde então seaborn é um wrapper em torno de matplotlib Eu também li em matplotlib .pyplot 
import matplotlib .pyplot as plt 
# lendo em um conjunto de dados como quadro de dados usando pandas; 
# os dados são dados de produção da indústria automotiva OICA 
data_df.head()
anopaíssaída
02018Argentina466649
12018Áustria164900
22018Bélgica308493
32018Brasil2879809
42018Canadá2020840
# vamos ver também a cauda 
data_df.tail()
anopaíssaída
8351999Ucrânia1918
8361999Reino Unido1973519
8371999EUA13024978
8381999Uzbequistão44433
8391999Outras11965
# vamos tentar .describe() 
data_df.describe()
anosaída
contar840,0000008.400000e+02
significar2008.2845241.840118e+06
std5.7098083.407141e+06
min1999.0000003,600000e+01
25%2004.0000001.633742e+05
50%2008.0000005.586175e+05
75%2013.0000001.970880e+06
máximo2018.0000002.901543e+07
plt.figure(figsize=(20,15))
plot1 = seaborn.scatterplot(x="year",y="output ",hue="country ", data=data_df)
plot1.set_title("production output by year (OICA data)", fontsize=22)
plot1.set_xlabel("year",fontsize=16)
Text(0, 0.5, 'saída')
# defina o tamanho do gráfico com matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# gire os pontos do eixo x em 90 graus 
plt.xticks(rotation=90) 
# vamos criar um gráfico boxplot 
plot2 = seaborn.boxplot(x ="country ",y="output ",data=data_df) 
# set title 
plot2.set_title("distribuição anual da produção por nação, 1999 - 2018 (dados OICA)",fontsize=22) 
# adiciona rótulos a x- e y-xis 
plot2.set_xlabel("país",fontsize=16) 
plot2.set_ylabel("produção anual",fontsize=16)
Text(0, 0.5, 'produção anual')
# swarm plots, usando seaborn 
# defina o tamanho do gráfico usando matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# rotacione os carrapatos do eixo no eixo x 
plt.xticks(rotation=90) 
# defina o estilo seaborn padrão 
seaborn.set_style ("whitegrid") 
# define o contexto padrão 
seaborn.set_context("talk") 
# cria o enxame 
plot3 = seaborn.swarmplot(x="country ",y="output ",data=data_df,color="green") 
# set title 
plot3.set_title("produção anual da indústria automotiva por país de 1999 a 2018, de acordo com a OICA",fontsize=22) 
# set axis labels 
plot3.set_xlabel("country",fontsize=22) 
# adicionar linha de referência,usando.pyplot 
plt.axhline(data_df["output "].mean(),color="blue")
<matplotlib.lines.Line2D em 0x2b02ec39b88>
plt.figure(figsize=(20,15))

seaborn.set_context("paper")

plot4 = seaborn.lineplot(x="year",y="output ",hue="country ",data=data_df)

plot4.set_title("OICA automotive industry production output time series, 1999 - 2018",fontsize=22)

plot4.set_xlabel("year",fontsize=22)
plot4.set_ylabel("production output [units]",fontsize=22)
Text(0, 0.5, 'saída de produção [unidades]')

You May Also Like

Leave a Reply

Leave a Reply

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.