Este post é uma introdução aproximada ao módulo Seaborn em Python. Eu o uso para visualização de dados, em combinação com o Pandas. Leia os comentários para entender meu fluxo de trabalho. Qualquer dúvida pode deixar como comentário no final do post.
# pandas é um módulo python para trabalhar com quadros de dados
import pandas
# seaborn é um wrapper para matplotlib e serve para visualização de dados
import seaborn
# pandas e numpy estão relacionados, portanto eu sempre leio em numpy ao trabalhar com pandas
import numpy
# e desde então seaborn é um wrapper em torno de matplotlib Eu também li em matplotlib .pyplot
import matplotlib .pyplot as plt
# lendo em um conjunto de dados como quadro de dados usando pandas;
# os dados são dados de produção da indústria automotiva OICA
data_df.head()
ano
país
saída
0
2018
Argentina
466649
1
2018
Áustria
164900
2
2018
Bélgica
308493
3
2018
Brasil
2879809
4
2018
Canadá
2020840
# vamos ver também a cauda
data_df.tail()
ano
país
saída
835
1999
Ucrânia
1918
836
1999
Reino Unido
1973519
837
1999
EUA
13024978
838
1999
Uzbequistão
44433
839
1999
Outras
11965
# vamos tentar .describe()
data_df.describe()
ano
saída
contar
840,000000
8.400000e+02
significar
2008.284524
1.840118e+06
std
5.709808
3.407141e+06
min
1999.000000
3,600000e+01
25%
2004.000000
1.633742e+05
50%
2008.000000
5.586175e+05
75%
2013.000000
1.970880e+06
máximo
2018.000000
2.901543e+07
plt.figure(figsize=(20,15))
plot1 = seaborn.scatterplot(x="year",y="output ",hue="country ", data=data_df)
plot1.set_title("production output by year (OICA data)", fontsize=22)
plot1.set_xlabel("year",fontsize=16)
Text(0, 0.5, 'saída')
# defina o tamanho do gráfico com matplotlib .pyplot
plt.figure(figsize=(20,15))
# gire os pontos do eixo x em 90 graus
plt.xticks(rotation=90)
# vamos criar um gráfico boxplot
plot2 = seaborn.boxplot(x ="country ",y="output ",data=data_df)
# set title
plot2.set_title("distribuição anual da produção por nação, 1999 - 2018 (dados OICA)",fontsize=22)
# adiciona rótulos a x- e y-xis
plot2.set_xlabel("país",fontsize=16)
plot2.set_ylabel("produção anual",fontsize=16)
Text(0, 0.5, 'produção anual')
# swarm plots, usando seaborn
# defina o tamanho do gráfico usando matplotlib .pyplot
plt.figure(figsize=(20,15))
# rotacione os carrapatos do eixo no eixo x
plt.xticks(rotation=90)
# defina o estilo seaborn padrão
seaborn.set_style ("whitegrid")
# define o contexto padrão
seaborn.set_context("talk")
# cria o enxame
plot3 = seaborn.swarmplot(x="country ",y="output ",data=data_df,color="green")
# set title
plot3.set_title("produção anual da indústria automotiva por país de 1999 a 2018, de acordo com a OICA",fontsize=22)
# set axis labels
plot3.set_xlabel("country",fontsize=22)
# adicionar linha de referência,usando.pyplot
plt.axhline(data_df["output "].mean(),color="blue")
<matplotlib.lines.Line2D em 0x2b02ec39b88>
plt.figure(figsize=(20,15))
seaborn.set_context("paper")
plot4 = seaborn.lineplot(x="year",y="output ",hue="country ",data=data_df)
plot4.set_title("OICA automotive industry production output time series, 1999 - 2018",fontsize=22)
plot4.set_xlabel("year",fontsize=22)
plot4.set_ylabel("production output [units]",fontsize=22)
We use cookies on our website to give you the most relevant experience by remembering your preferences and repeat visits. By clicking “Accept”, you consent to the use of ALL the cookies.
This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Leave a Reply