PANDAS DATEFRAME HISTOGRAMO

PANDAS DATEFRAME HISTOGRAMO
Podemos fazer o quadro de dados contendo diferentes campos e linhas em pandas. Os dados são inseridos nessas linhas e colunas. Podemos desenhar o "histograma" do quadro de dados em pandas. Um "histograma" é freqüentemente usado para mostrar como os dados numéricos são distribuídos. Você frequentemente deseja compreender rapidamente como as variáveis ​​numéricas específicas são distribuídas por um conjunto de dados ao investigar. Um histograma é usado para fazer isso. Os pandas fornecem o método "hist ()" para desenhar o histograma.

Os pandas.Quadro de dados.A técnica hist () é utilizada para determinar como as variáveis ​​numéricas são distribuídas. Os valores são divididos em variáveis ​​numéricas por esta função. Seu objetivo principal é criar um histograma a partir de um quadro de dados especificado. Quando o quadro de dados de pandas.O método HIST () é utilizado, todas as séries no quadro de dados especificadas são passadas automaticamente para o matplotlib. Pyplot.Método Hist (). Em troca, obtemos um histograma para cada coluna. Plotaremos o histograma do DataFrame neste guia, utilizando o método "Hist ()" de pandas.

Sintaxe:

Quadro de dados.hist (dados, coluna = nenhum, por = nenhum, grade = true, xlabelsize = nenhum, xrot = nenhum, ylabelsize = nenhum, yrot = nenhum, ax = nenhum, sharex = false, sharey = false, figSize = nenhum, layout = Nenhum, caixa = 10, back -end = Nenhum, legenda = false, ** Kwargs)

Exemplo 1:

Os códigos de pandas neste guia são realizados na ferramenta "Spyder". Na primeira linha, importamos os “pandas como PD”. Em seguida, criamos um dadoframe de "valores" usando o "PD.DataFrame () ”Método. Desenvolvemos duas colunas do quadro de dados de "valores" que são "comprimento l" e "largura b". E colocamos os valores numéricos em cada um deles. Em "comprimento l", inserimos "2.7, 8.7, 3.4, 2.4 e 1.Valor numérico de 9 ”. Enquanto estiver em "Brexh B", inserimos "4.24, 2.67, 7.6, 7.1 e 4.Vlaues numéricos de 9 ”. Agora, desenhamos o histograma desses dados do DataFrame. Inicializamos a variável "Hist" com o "DataFrame.Hist () ”Método e insira os“ Bins = 6 ”.

Um histograma avalia o número de medições que ocorrem em cada compartimento depois de dividir os valores contidos em uma variável numérica em “BINS.”Podemos ganhar rápida e facilmente uma compreensão instintiva da distribuição de valores dentro de uma variável, representando visualmente as contagens de binned de uma maneira colunar.


Esta saída aparece no console do Spyder quando pressionamos as teclas "Shift + Enter" no teclado. Aqui, temos dois histogramas. Estes são os histogramas daqueles dados que inserimos no Código Pandas.

Exemplo 2:

Geramos o quadro de dados de "valores" aqui que contém três colunas que são "b_1, h_1 e l_1", que mostram a largura, a altura e o comprimento, respectivamente. Adicionamos “4.24, 2.67, 7.6, 7.1 e 4.9 "em" B_1 ". Adicionamos também adicionar “6.8, 5.5, 4.8, 11.88 e 1.1 "em" H_1 ". Então, inserimos “3.7, 9.7, 3.4, 4.4 e 2.9 "em" L_1 ". Depois disso, utilizamos o método "hist ()" que converte esses valores numéricos em um histograma. Ele desenha três histogramas separados. O valor "Bins" que definimos aqui é "12".


Três gráficos de histograma diferentes aparecem na saída. O primeiro histograma é dos dados "B_1", o segundo gráfico de histograma é dos dados "H_1", e o último é dos dados "L_1".

Exemplo 3:

Agora, desenhamos quatro histogramas distintos neste exemplo. Para isso, criamos quatro colunas do DataFrame como "Dados 1, dados 2, dados 3 e dados 4". Em "Data 1", adicionamos alguns valores que são "2.7, 0.0, 1.4, 2.4 e 1.9 ”. Colocamos “4.24, 2.67, 7.6, 7.1 e 4.9 "em" Data 2 ". Adicione “5.8, 5.5, 7.8, 10.88 e 0.1 "para" Data 3 ". E adicione os valores “20, 40.8, 55.8, 7.2 e 48 "em" Data 4 ". Depois disso, desenhamos o histograma de todas essas colunas separadamente. Utilizamos a técnica "Hist ()" com o nome do DataFrame e definimos suas "caixas" como "8". Ele gera quatro histogramas distintos na tela de saída.


Criamos esses histogramas fornecidos com a ajuda da função "hist ()" em pandas. Todas as colunas contêm dados diferentes; portanto, todos os quatro histogramas aqui são diferentes um do outro.

Exemplo 4:

Também podemos desenhar o histograma dos dados que estão presentes no arquivo CSV. Agora, neste exemplo, plotamos os histogramas dos dados do arquivo CSV. Para isso, importamos o “matplotlib.Biblioteca Pyplot "como" PLT ". Temos as funções desta biblioteca colocando o objeto "PLT" em vez do "matplotlib.pyplot ”. Agora, lemos o arquivo CSV utilizando o método "read_csv". Especificamos o nome do arquivo que contém os dados que queremos importar para um DataFrame no "read_csv ()".

Aqui, o arquivo é chamado de “arquivo.CSV ”. Os dados do “arquivo.CSV "é armazenado no" DF "na forma de DataFrame. Renderizamos os dados do arquivo na forma de dataframe no console. Em seguida, aplicamos o método "hist ()" no qual colocamos o nome da coluna presente no arquivo CSV. Este nome da coluna é "s_name". Quando os histogramas são criados, esse nome aparece lá. O "FigSize" que utilizamos aqui é usado para ajustar o tamanho da imagem do histograma que definimos como "12" para a "largura" e "8" para a "altura" do tamanho do gráfico do histograma.

Além disso, as “caixas” estão definidas como “15”. No final, colocamos o “PLT.Método Show () ”. O “plt. Método Show () ”lança um loop de eventos, pesquisa todas as entidades da figura existente e lança várias janelas interativas que demonstram seu gráfico ou gráficos.


Aqui, ele exibe primeiro os dados que estão presentes no arquivo CSV na forma de DataFrame. Então, ele plota os gráficos dos dados numéricos separadamente para cada.


Você verá que temos seis gráficos distintos aqui. Os nomes dos alunos são mencionados em cada gráfico, pois ajustamos este "s_name" no código. Então, este "s_name" é renderizado aqui em cima de cada gráfico.

Exemplo 5:

Nós novamente importamos as duas bibliotecas que são "pandas" e "matplotlib.Pyplot "neste código como" PD "e" PLT ", respectivamente. Então, desenhamos o histograma do “escritório.Arquivo CSV ”colocando o método“ read_csv () ”primeiro e depois usando a função simples“ hist () ”. Além disso, exibimos os dados do arquivo do Office como um DataFrame no terminal antes de usar o método "Hist ()". Adicionamos o “PLT. Mostrar () ”função que explicamos no exemplo anterior.


O quadro de dados do “escritório.O arquivo csv ”é renderizado. Seus histogramas são exibidos na seguinte ilustração. Aqui, os dados do arquivo CSV são mostrados pela primeira vez na forma de um dataframe.


Dois gráficos de histograma são exibidos na saída, uma vez que esse quadro de dados contém apenas duas colunas que possuem os dados numéricos,.

Exemplo 6:

Este é o nosso último exemplo para este guia. Criamos o quadro de dados “cars_df” e inserimos duas colunas. O "nome do carro" contém os nomes dos carros e o "Challan Price" contém o preço do Challan. Depois disso, acessamos a função "hist ()" do "PLT", que é a biblioteca que importamos no início do código. Passamos o nome da coluna “Challan_Price” no “PLT. Hist () ”funcionam e utilizam o“ PLT. Método Show () ”.


Este é o gráfico de histograma deste código que é desenhado com base nos valores numéricos presentes na coluna “Challan_Price”.

Conclusão

O método "hist ()" em pandas é demonstrado neste guia. Nosso principal objetivo é transmitir a idéia do método "hist ()" em pandas de maneira simples e sucinta. Explicamos como usar a função Pandas "Hist ()" para desenhar o histograma dos dados numéricos do DataFrame. Explicamos que o "histograma" é uma representação visual de como os dados são distribuídos. Você poderá passar para um estágio mais complicado da programação do Pandas depois de ler este guia. Esperamos que você se beneficie bastante no futuro deste guia.