Isso parece muito para cobrir. Vamos começar agora.
O que é Python Seaborn Library?
Seaborn Library é um pacote Python que nos permite fazer infográficos com base em dados estatísticos. Como é feito em cima do matplotlib, é inerentemente compatível com ele. Além disso, ele suporta a estrutura de dados Numpy e Pandas para que a plotagem possa ser feita diretamente a partir dessas coleções.
Visualizar dados complexos é uma das coisas mais importantes que Seaborn cuida de. Se compararmos o Matplotlib com o Seaborn, Seaborn é capaz de facilitar as coisas que são difíceis de alcançar com o Matplotlib. No entanto, é importante notar que Seaborn não é uma alternativa ao matplotlib, mas um complemento disso. Ao longo desta lição, usaremos as funções matplotlib nos trechos de código também. Você selecionará trabalhar com Seaborn nos seguintes casos de uso:
Apenas uma nota antes de começar é que usamos um ambiente virtual para esta lição que fizemos com o seguinte comando:
python -m virtualenv SeabornDepois que o ambiente virtual estiver ativo, podemos instalar a Biblioteca Seaborn no Env virtual, para que exemplos que criamos a seguir possam ser executados:
PIP Instale SeaBornVocê também pode usar o anaconda para executar esses exemplos, o que é mais fácil. Se você quiser instalá -lo em sua máquina, veja a lição que descreve “como instalar o Anaconda Python no Ubuntu 18.04 LTS ”e compartilhe seu feedback. Agora, vamos avançar para vários tipos de parcelas que podem ser construídas com Python Seaborn.
Usando o conjunto de dados Pokemon
Para manter esta lição prática, usaremos o conjunto de dados Pokemon que pode ser baixado de Kaggle. Para importar esse conjunto de dados para o nosso programa, usaremos a Biblioteca Pandas. Aqui estão todas as importações que realizamos em nosso programa:
importar pandas como PDAgora, podemos importar o conjunto de dados para o nosso programa e mostrar alguns dos dados de amostra com pandas como:
df = pd.read_csv ('Pokemon.csv ', index_col = 0)Observe que, para executar o snippet de código acima, o conjunto de dados CSV deve estar presente no mesmo diretório que o próprio programa. Quando executarmos o trecho de código acima, veremos a seguinte saída (no caderno de Anaconda Jupyter):
Plotando curva de regressão linear
Uma das melhores coisas sobre o SeaBorn são as funções inteligentes de plotagem que ele fornece, que não apenas visualiza o conjunto de dados que fornecemos a ele, mas também constrói modelos de regressão em torno dele. Por exemplo, é possível construir um gráfico de regressão linear com uma única linha de código. Aqui está como fazer isso:
SNS.lmplot (x = 'ataque', y = 'defesa', dados = df)Depois de executar o trecho de código acima, veremos a seguinte saída:
Percebemos poucas coisas importantes no trecho de código acima:
Não tenha medo se você pensou que não podemos ter um enredo sem essa linha de regressão. Pudermos ! Vamos tentar um novo snippet de código agora, semelhante ao último:
SNS.lmplot (x = 'ataque', y = 'defesa', dados = df, fit_reg = false)Desta vez, não veremos a linha de regressão em nossa trama:
Agora isso é muito mais claro (se não precisarmos da linha de regressão linear). Mas isso ainda não acabou. Seaborn nos permite fazer diferentes esta trama e é isso que faremos.
Construindo gráficos da caixa
Uma das melhores características do SeaBorn é como ele aceita prontamente a estrutura do Pandas DataFrames para plotar dados. Podemos simplesmente passar um quadro de dados para a Biblioteca Seaborn para que ela possa construir uma caixa de caixa:
SNS.boxplot (dados = df)Depois de executar o trecho de código acima, veremos a seguinte saída:
Podemos remover a primeira leitura do total, pois isso parece um pouco estranho quando estamos na verdade plotando colunas individuais aqui:
Depois de executar o trecho de código acima, veremos a seguinte saída:
Trama de enxame com Seaborn
Podemos construir uma trama intuitiva de enxame de design com Seaborn. Estaremos novamente usando o quadro de dados dos pandas que carregamos mais cedo, mas desta vez, chamaremos a função de show de Matplotlib para mostrar o enredo que fizemos. Aqui está o trecho de código:
SNS.set_context ("papel")Depois de executar o trecho de código acima, veremos a seguinte saída:
Ao usar um contexto marítimo, permitimos que o Seaborn adicione um toque pessoal e um design fluido para o enredo. É possível personalizar esse enredo ainda mais com o tamanho da fonte personalizado usado para rótulos no enredo para facilitar a leitura. Para fazer isso, passaremos mais parâmetros para a função set_context que executa exatamente o que eles parecem. Por exemplo, para modificar o tamanho da fonte dos rótulos, usaremos a fonte.parâmetro de tamanho. Aqui está o trecho de código para fazer a modificação:
Depois de executar o trecho de código acima, veremos a seguinte saída:
O tamanho da fonte do rótulo foi alterado com base nos parâmetros que fornecemos e o valor associado à fonte.parâmetro de tamanho. Uma coisa que Seaborn é especialista é tornar a trama muito intuitiva para o uso prático e isso significa que o SeaBorn não é apenas um pacote de Python prático, mas na verdade algo que podemos usar em nossas implantações de produção.
Adicionando um título às parcelas
É fácil adicionar títulos às nossas parcelas. Só precisamos seguir um procedimento simples de usar as funções no nível dos eixos, onde chamaremos o set_title () função como mostramos no snippet de código aqui:
SNS.set_context ("papel", font_scale = 3, rc = "font.tamanho ": 8," eixos.Labelsize ": 5)Depois de executar o trecho de código acima, veremos a seguinte saída:
Dessa forma, podemos adicionar muito mais informações às nossas parcelas.
Seaborn vs Matplotlib
Enquanto analisamos os exemplos nesta lição, podemos identificar que Matplotlib e Seaborn não podem ser comparados diretamente, mas eles podem ser vistos como se complementando. Um dos recursos que leva o Seaborn 1 passo à frente é a maneira como o Seaborn pode visualizar dados estatisticamente.
Para fazer o melhor dos parâmetros marítimos, é altamente recomendável olhar para a documentação marítima e descobrir quais parâmetros usar para tornar sua trama o mais próximo possível das necessidades de negócios.
Nesta lição, analisamos vários aspectos dessa biblioteca de visualização de dados que podemos usar com o Python para gerar gráficos bonitos e intuitivos que podem visualizar dados de uma forma que a empresa deseja de uma plataforma. O SeaBorm é uma das bibliotecas de visualização mais importantes quando se trata de engenharia de dados e apresentar dados na maioria das formas visuais, definitivamente uma habilidade que precisamos ter em nosso cinto, pois nos permite criar modelos de regressão linear.
Compartilhe seus comentários sobre a lição no Twitter com @sbmaggarwal e @linuxhint.