Tutorial de Python Seaborn

Tutorial de Python Seaborn
Nesta lição sobre a Biblioteca Python Seaborn, examinaremos vários aspectos dessa biblioteca de visualização de dados que podemos usar com o Python para gerar gráficos bonitos e intuitivos que podem visualizar dados de uma forma que a empresa deseja de uma plataforma. Para concluir esta lição, abordaremos as seguintes seções:
  • O que é Python Seaborn?
  • Tipos de parcelas que podemos construir com o Seaborn
  • Trabalhando com várias parcelas
  • Algumas alternativas para Python Seaborn

Isso parece muito para cobrir. Vamos começar agora.

O que é Python Seaborn Library?

Seaborn Library é um pacote Python que nos permite fazer infográficos com base em dados estatísticos. Como é feito em cima do matplotlib, é inerentemente compatível com ele. Além disso, ele suporta a estrutura de dados Numpy e Pandas para que a plotagem possa ser feita diretamente a partir dessas coleções.

Visualizar dados complexos é uma das coisas mais importantes que Seaborn cuida de. Se compararmos o Matplotlib com o Seaborn, Seaborn é capaz de facilitar as coisas que são difíceis de alcançar com o Matplotlib. No entanto, é importante notar que Seaborn não é uma alternativa ao matplotlib, mas um complemento disso. Ao longo desta lição, usaremos as funções matplotlib nos trechos de código também. Você selecionará trabalhar com Seaborn nos seguintes casos de uso:

  • Você tem dados estatísticos de séries temporais a serem plotadas com a representação da incerteza em torno das estimativas
  • Para estabelecer visualmente a diferença entre dois subconjuntos de dados
  • Para visualizar as distribuições univariadas e bivariadas
  • Adicionando muito mais afeto visual às parcelas de matplotlib com muitos temas embutidos
  • Para ajustar e visualizar modelos de aprendizado de máquina através de regressão linear com variáveis ​​independentes e dependentes

Apenas uma nota antes de começar é que usamos um ambiente virtual para esta lição que fizemos com o seguinte comando:

python -m virtualenv Seaborn
Fonte Seaborn/Bin/Ative

Depois que o ambiente virtual estiver ativo, podemos instalar a Biblioteca Seaborn no Env virtual, para que exemplos que criamos a seguir possam ser executados:

PIP Instale SeaBorn

Você também pode usar o anaconda para executar esses exemplos, o que é mais fácil. Se você quiser instalá -lo em sua máquina, veja a lição que descreve “como instalar o Anaconda Python no Ubuntu 18.04 LTS ”e compartilhe seu feedback. Agora, vamos avançar para vários tipos de parcelas que podem ser construídas com Python Seaborn.

Usando o conjunto de dados Pokemon

Para manter esta lição prática, usaremos o conjunto de dados Pokemon que pode ser baixado de Kaggle. Para importar esse conjunto de dados para o nosso programa, usaremos a Biblioteca Pandas. Aqui estão todas as importações que realizamos em nosso programa:

importar pandas como PD
De Matplotlib Import pyplot como PLT
Importar Seaborn como SNS

Agora, podemos importar o conjunto de dados para o nosso programa e mostrar alguns dos dados de amostra com pandas como:

df = pd.read_csv ('Pokemon.csv ', index_col = 0)
df.cabeça()

Observe que, para executar o snippet de código acima, o conjunto de dados CSV deve estar presente no mesmo diretório que o próprio programa. Quando executarmos o trecho de código acima, veremos a seguinte saída (no caderno de Anaconda Jupyter):

Plotando curva de regressão linear

Uma das melhores coisas sobre o SeaBorn são as funções inteligentes de plotagem que ele fornece, que não apenas visualiza o conjunto de dados que fornecemos a ele, mas também constrói modelos de regressão em torno dele. Por exemplo, é possível construir um gráfico de regressão linear com uma única linha de código. Aqui está como fazer isso:

SNS.lmplot (x = 'ataque', y = 'defesa', dados = df)

Depois de executar o trecho de código acima, veremos a seguinte saída:

Percebemos poucas coisas importantes no trecho de código acima:

  • Há uma função dedicada de plotagem disponível em Seaborn
  • Usamos a função de encaixe e plotagem de Seaborn, que nos forneceu uma linha de regressão linear que ela se modelou

Não tenha medo se você pensou que não podemos ter um enredo sem essa linha de regressão. Pudermos ! Vamos tentar um novo snippet de código agora, semelhante ao último:

SNS.lmplot (x = 'ataque', y = 'defesa', dados = df, fit_reg = false)

Desta vez, não veremos a linha de regressão em nossa trama:

Agora isso é muito mais claro (se não precisarmos da linha de regressão linear). Mas isso ainda não acabou. Seaborn nos permite fazer diferentes esta trama e é isso que faremos.

Construindo gráficos da caixa

Uma das melhores características do SeaBorn é como ele aceita prontamente a estrutura do Pandas DataFrames para plotar dados. Podemos simplesmente passar um quadro de dados para a Biblioteca Seaborn para que ela possa construir uma caixa de caixa:

SNS.boxplot (dados = df)

Depois de executar o trecho de código acima, veremos a seguinte saída:

Podemos remover a primeira leitura do total, pois isso parece um pouco estranho quando estamos na verdade plotando colunas individuais aqui:

stats_df = df.Drop (['total'], eixo = 1)
# NOVO BOXPLOT usando STATS_DF
SNS.BoxPlot (Data = STATS_DF)

Depois de executar o trecho de código acima, veremos a seguinte saída:

Trama de enxame com Seaborn

Podemos construir uma trama intuitiva de enxame de design com Seaborn. Estaremos novamente usando o quadro de dados dos pandas que carregamos mais cedo, mas desta vez, chamaremos a função de show de Matplotlib para mostrar o enredo que fizemos. Aqui está o trecho de código:

SNS.set_context ("papel")
SNS.SwarmPlot (x = "ataque", y = "defesa", dados = df)
plt.mostrar()

Depois de executar o trecho de código acima, veremos a seguinte saída:

Ao usar um contexto marítimo, permitimos que o Seaborn adicione um toque pessoal e um design fluido para o enredo. É possível personalizar esse enredo ainda mais com o tamanho da fonte personalizado usado para rótulos no enredo para facilitar a leitura. Para fazer isso, passaremos mais parâmetros para a função set_context que executa exatamente o que eles parecem. Por exemplo, para modificar o tamanho da fonte dos rótulos, usaremos a fonte.parâmetro de tamanho. Aqui está o trecho de código para fazer a modificação:

SNS.set_context ("papel", font_scale = 3, rc = "font.tamanho ": 8," eixos.Labelsize ": 5)
SNS.SwarmPlot (x = "ataque", y = "defesa", dados = df)
plt.mostrar()

Depois de executar o trecho de código acima, veremos a seguinte saída:

O tamanho da fonte do rótulo foi alterado com base nos parâmetros que fornecemos e o valor associado à fonte.parâmetro de tamanho. Uma coisa que Seaborn é especialista é tornar a trama muito intuitiva para o uso prático e isso significa que o SeaBorn não é apenas um pacote de Python prático, mas na verdade algo que podemos usar em nossas implantações de produção.

Adicionando um título às parcelas

É fácil adicionar títulos às nossas parcelas. Só precisamos seguir um procedimento simples de usar as funções no nível dos eixos, onde chamaremos o set_title () função como mostramos no snippet de código aqui:

SNS.set_context ("papel", font_scale = 3, rc = "font.tamanho ": 8," eixos.Labelsize ": 5)
my_plot = SNS.SwarmPlot (x = "ataque", y = "defesa", dados = df)
my_plot.set_title ("LH Swarm Plot")
plt.mostrar()

Depois de executar o trecho de código acima, veremos a seguinte saída:

Dessa forma, podemos adicionar muito mais informações às nossas parcelas.

Seaborn vs Matplotlib

Enquanto analisamos os exemplos nesta lição, podemos identificar que Matplotlib e Seaborn não podem ser comparados diretamente, mas eles podem ser vistos como se complementando. Um dos recursos que leva o Seaborn 1 passo à frente é a maneira como o Seaborn pode visualizar dados estatisticamente.

Para fazer o melhor dos parâmetros marítimos, é altamente recomendável olhar para a documentação marítima e descobrir quais parâmetros usar para tornar sua trama o mais próximo possível das necessidades de negócios.

Conclusão

Nesta lição, analisamos vários aspectos dessa biblioteca de visualização de dados que podemos usar com o Python para gerar gráficos bonitos e intuitivos que podem visualizar dados de uma forma que a empresa deseja de uma plataforma. O SeaBorm é uma das bibliotecas de visualização mais importantes quando se trata de engenharia de dados e apresentar dados na maioria das formas visuais, definitivamente uma habilidade que precisamos ter em nosso cinto, pois nos permite criar modelos de regressão linear.

Compartilhe seus comentários sobre a lição no Twitter com @sbmaggarwal e @linuxhint.