Histograma da série Pandas

Histograma da série Pandas

“A distribuição de frequência de uma matriz numérica é tipicamente representada por um histograma, que é organizado em caixas discretas e de tamanho igual. O método “pandas.Series.hist () ”e“ pandas.Series.plot () ”são amplamente utilizados. Eles podem ser utilizados para plotar histogramas rapidamente usando a série Pandas.”

A sintaxe “Série.Hist () ”o método segue:

Sintaxe para “Série.plot () ”função:

Este artigo demonstrará a implementação de ambos os métodos para plotar histogramas.

Exemplo # 1: Utilizando a série.Método Hist () para plotar um histograma

Podemos traçar uma série de pandas empregando a série Pandas “.Hist () ”Método. A execução prática desta técnica pode ser observada nesta demonstração.

Induzimos a ferramenta "Spyder" para compilar os programas Python em nosso sistema. O lançamento da ferramenta nos leva à interface. Por padrão, ele abrirá um arquivo com o nome “Temp.py ". Você pode modificar o nome e “.py ”é a extensão dos arquivos python.

Neste arquivo python, iniciamos o script carregando primeiro os pacotes necessários. A biblioteca que importamos para o nosso ambiente Python é o "pandas". Essa pergunta pode surgir em sua mente, por que importamos pandas da ampla gama de pacotes que o Python oferece? Carregamos este kit de ferramentas porque trabalharemos na plotagem de histogramas com a série Pandas.

Para gerar uma série, empregaremos um método pandas, “PD.Série () ”e traçar um histograma desta série, outro método de pandas,“ Série.Hist () ”será exercido neste guia. Então, importamos "pandas como PD" para o nosso arquivo python. Agora vamos avançar para o início do script.

Para plotar os histogramas dos pandas usando uma série, o requisito inicial é gerar uma série de pandas. Para construir a série Pandas, o “PD.O método da série () ”é invocado. Usamos dois parâmetros para esta função: "Data" e "Nome". Os valores da série serão contidos nos "dados", enquanto o nome desta lista de valores é atribuído em "nome". Os valores “dados” estão segurando “12, 32, 45, 65, 76, 32, 19, 34, 76, 89, 45, 35, 76, 89, 90, 44, 14, 33, 56, 69, 65 , 44, 36, 57, 23, 41, 78, 32, 47, 81 ”. Então, nossa série será gerada com 30 valores. Nomeamos esta lista de "vendas". O “PD.A função Série () ”construirá a série com valores anexos, mas não possui nenhum armazenamento para manter esta série para uso posterior.

Para isso, criamos um objeto de série, chamado "import_report" e atribuímos o resultado gerado ao invocar o "PD.Método da série (). A apresentação desta série recém -construída pode ser possível, utilizando o método "print ()" de python. Este método funciona tomando qualquer tipo de entrada e processando -o para exibir o resultado no terminal. Aqui usamos o “.Método Head () ”com o nome da série porque o registro armazenado na série é muito longo, por isso preferimos ver apenas alguns valores iniciais. O ".Método de Head () ”, por padrão, exibe as 5 primeiras entradas.

A imagem abaixo apresenta uma série renderizada na janela de saída, tendo os 5 primeiros valores sendo colocados em exibição. O nome da lista é mencionado abaixo e também seu tipo de dados é identificado como "Int64".

Para mapear um histograma de uma série de pandas, obtivemos a função “Série.hist () ”do kit de ferramentas de pandas. Este método simplesmente pega os valores de uma série e plota um histograma usando -os. Para implementar este método, nós o invocamos em nosso programa Python. O nome da série "import_report" é fornecido com o ".Hist () ”Método. Em seguida, acabamos de executar o programa, atingindo a opção "Run File".

Isso gerará um enredo na tela, que é exibido com barras. Os valores no eixo y são de 0-8, o que representa a frequência, enquanto o eixo x tem intervalos de 10-90.

Podemos personalizar este histograma alterando o número de caixas. Para isso, temos um parâmetro "BIN". Passamos este parâmetro para a “série.Hist () ”função. Os pandas criam caixas por padrão, mas podemos modificá -las, se necessário. Então, fornecemos aos "caixas" um valor de "8". Ele espalhará nossos dados em 8 barras no histograma.

Você pode observar que o visual anterior tinha 10 caixas, mas este possui 8 barras.

Exemplo # 2: Utilizando a série.Método plot () para plotar um histograma

A outra técnica que vamos usar neste tutorial é a série Pandas “.plot () ”método. Por padrão, ele cria um gráfico de linhas, mas podemos especificar particularmente o tipo de enredo que queremos visualizar nossos dados.

O programa para este método começa importando a biblioteca de pandas. Carregamos o módulo pandas e criamos seu pseudônimo como "PD". Agora vamos acessar o método dos pandas que precisamos escrever "PD" em vez de "pandas". O primeiro método que invocamos do kit de ferramentas de pandas é o “PD.Série () ”para a construção de uma série de pandas. O “PD.O método da série () ”é empregado com dois atributos,“ dados ”e“ nome ”.

A lista de valores é armazenada em "dados" e o título da lista é definido em "nome". Os valores que fornecemos para a criação da série são “20, 34, 45, 67, 64, 78, 98, 72, 12, 34, 17, 92, 56, 77, 63, 37, 29, 11, 20, 80, 44, 21, 37, 65, 48, 88, 24, 37, 33, 19, 74, 26 ”. A contagem total de valores armazenados nesta lista é 32. O nome que definimos para a lista de valores é "valores". A série será preservada em um objeto de série para nos permitir usá -lo mais tarde. Criamos um objeto da série "My_Series" e o atribuímos à série recém -criada.

Como a série que geramos é muito longa e não pode ser vista em um único instantâneo, então decidimos exibir apenas as entradas iniciais, exercitando a “série.Método de Head () "dentro da função" print () ".

Nome da série, Datatype da série e os valores da série foram exibidos no console Python.

Agora usaremos esta série para criar sua representação visual com a ajuda de um enredo.

As séries.Método plot () ”é invocado. Aqui mencionamos o nome da nossa série como "my_series" com o ".plot () ”função. Entre os parênteses deste método, o parâmetro "tipo" é usado. Este atributo definirá o tipo de enredo a ser retirado. Como queremos plotar um histograma, especificamos o "tipo" como "Hist".

Nosso histograma é gerado na tela, que contém 10 caixas para distribuição de valores.

Podemos mudar a formatação de nossa trama. Para isso, criamos uma variável "contêiner" para salvar o histograma nele. Em seguida, empregamos o "set_xlabe () l" para identificar um rótulo "lista de valores" que será mostrada no eixo x. Além disso, para definir o rótulo do histograma, utilizamos o método "set_title ()" para tocar um enredo como "Este é o nosso enredo de demonstração".

Você pode ver os resultados no enredo de histograma visual abaixo apresentado.

Conclusão

Visualizar uma série de dados criando gráficos é uma técnica muito útil para análise de dados rápidos. Esta lição apresentou você aos dois métodos para plotar o histograma usando a série Pandas. A primeira técnica que discutimos é a “série.Método Hist () ”, que também explora o conceito de alteração de caixas. A segunda função que está sendo exercida é a “série.plot () ”método. Nesta técnica, aprendemos a mudar a formatação do enredo de acordo com nossas necessidades.