Método de informações de pandas

Método de informações de pandas
“O módulo de pandas do Python é usado para modificar os conjuntos de dados. Oferece ferramentas para pesquisa de dados, filtragem, processamento e manipulação. A excelente comunidade de pacotes de informação do Python o torna uma linguagem eficaz para realizar análises de dados. Uma dessas ferramentas, pandas, simplifica bastante o processo de importação e análise de dados. Usando a função info (), você pode resumir rapidamente um DataFrame. Este método exibe detalhes sobre um quadro de dados, como seus valores não nulos, utilização da memória e os tipos de dados de índice e coluna para imprimir o resumo completo. Ele imprime apenas os dados contidos no quadro de dados fornecidos e não retorna o valor. Ao realizar um estudo exploratório da informação, é útil. Utilizamos o quadro de dados.info () função para adquirir rapidamente um resumo do conjunto de dados.”

Método Sintaxe para Pandas ()

Discutiremos brevemente os parâmetros usados ​​aqui:

Verbose: A aplicação desta propriedade permite ao usuário escolher se deve explicar o relatório inteiro

BUF: Também não é obrigatório. Determina para onde outra saída deve ser enviada. Passe o buffer reescritivo se quiser modificar mais a saída.

Uso de memória: Indica se o uso geral de memória dos elementos de dados de dados, incluindo o índice, deve ser mostrado. Por padrão, isso adere ao valor dos pandas. opções.Display_memory Uso sempre exibe o uso da memória como "verdadeiro". Nunca exibir o uso da memória é "falso".

Max_col: Quando usar a saída reduzida em vez da saída detalhada. A saída truncada é utilizada se o quadro de dados contiver mais colunas do que o limite máximo de cols. A exibição de opções do panda.Max _info_ Valor das colunas é utilizado por padrão.

null_counts: Serve para indicar se deve ou não exibir contagens nulas.

Exemplo # 1: Exiba o resumo do quadro de dados usando o método de informações com o valor detalhado true

Falaremos sobre o Python Pandas Dataframe.Info () Método nesta demonstração. Para adquirir um relatório de dados de dados, usamos este método. Esta função exibe informações sobre um conjunto de dados, como o tipo de índice e colunas, valores não nulos e consumo de memória, quando é invocado em um quadro de dados. Agora vamos falar sobre o exemplo. Usamos três colunas neste exemplo; "Inteiros", "personagens" e "valores de flutuação". Existem quatro números baseados em número inteiro em colunas "Integer", "7", "8", "9" e "10". Selecionamos quatro valores para o caráter "adição", "subtração", "multiplicação" e "divisão". Na coluna, temos “valor flutuante” que tem esses valores “1.1 ”,“ 1.2 ”,“ 1.3 "e" 1.4 ”.

Depois disso, passamos esta lista de valores para gerar um quadro de dados empregando o “PD.método de quadro de dados ”fornecido pelo módulo do panda para construir o quadro de dados. Atribuímos novos rótulos a esta lista "Inteiro" como "int", "personagem" como "char" e "float_values" como "float"; Esses rótulos serão títulos de coluna do nosso quadro de dados de saída. Uma declaração “Descrição do quadro de dados” é exibida usando a função “print ()”.

Em seguida, chegamos à função principal do programa, que é o método "info ()" de dados. O quadro de dados.A função de informação é usada para obter uma visão geral simples do quadro de dados. “DF.info () ”está sendo usado aqui para fornecer uma visão geral do código. Nesse caso, o parâmetro que passamos para esta função é "detalhado". Este parâmetro possui dois valores possíveis; "verdadeiro ou falso". “Verbose = true” usado aqui significa exibir a informação inteira do quadro de dados. "True" Exibir uso de memória. Portanto, estamos usando o “df.info (verbose = true) ”função, que imprime todas as informações do quadro de dados.

Como mostrado no resultado, ele exibe um resumo do código; Primeiro, ele nos informa sobre a classe, que é “pandas.essencial.quadro.DataFrame ”, ele mostra o intervalo de índice que temos neste exemplo é“ 4 ”, o que significa que as informações que inserimos neste código são indexadas de 0 a 3; portanto, existem entradas de 0 a 3 no total. As “colunas de dados” no seguinte indicam que existem três colunas. A primeira coluna lista os nomes da coluna, a segunda coluna lista a contagem não nula e a terceira coluna lista os tipos de dados para os dados que inserimos. No final, ele menciona que os tipos de dados que temos são "Float64 (1)", "Int64 (1)" e "Objeto (1)", e isso usa 224.0+ bytes de memória.

Exemplo # 2: exibindo o resumo aplicando o método info () com valor detalhado false

Declarando nosso segundo exemplo importando o módulo do panda. Neste procedimento, um quadro de dados com três colunas é criado. Sua primeira coluna refere -se ao "número inteiro", o segundo como o "personagem" e o terceiro como o "valores de flutuação". Temos três valores na coluna "Inteiro", que são "4", "5" e "6" e na coluna "personagens", temos três variáveis ​​"A", "B" e "C" e para a coluna “Valores de flutuação”, temos “2.2 ”,“ 1.2 "e" 3.3 ”. Como o tamanho do índice é "3", significa que temos entradas de "0" para "2.”

Neste exemplo, o método "info ()" é usado para obter um relatório rápido dos quadros de dados sem mostrar o uso da memória. Usar verdadeiro ou falso em detalhe é indicar se imprimir ou não informações completas é opcional. O quadro de dados agora será exibido usando “PD. quadro de dados".

Portanto, usando a função "print ()", estamos exibindo a declaração "detalhe" na etapa a seguir. Então imprimimos a função “DF.info (verbose = false) ”. O uso desta função nos fornecerá uma visão geral concisa do código. Em vez de imprimir todo o quadro de dados e descrever seu conteúdo, esse método foi usado para explicar o código concisamente. Agora usando DF.info (verbose = false) ”ele simplesmente exibirá o“ detalhe ”e descreve.

A saída mostra que o "detalhe" é bastante conciso e claro. Como usamos "verbose = true" no exemplo anterior, todo o resumo e o quadro de dados do código foram exibidos; No entanto, usamos verbose = false nisso, então ele exibiu um resumo muito curto. Em "detalhes" primeiro, mostra a "classe", que é "pandas.essencial.quadro.quadro de dados".

O "intervalo de índice" é exibido na próxima linha, que é "3" indicando que o intervalo de entradas é de "0 a 2", então indica o número da coluna na qual existem três colunas; Talvez os tipos de dados dos dados que temos no quadro de dados sejam apresentados. “Float64 (1)”, “Int64 (1)”, “Int64 (1)” e objeto (1) são os tipos de dados.

Um objeto não é um tipo de dados, mas aqui é usado para o personagem. A próxima linha exibe o uso da memória, que exibe a quantidade de armazenamento gratuita no seu sistema, além de quanta memória está sendo usada por todos os programas abertos, incluindo Windows. O tamanho do uso da memória é “200.0+ bytes) ”.

Conclusão

Conversamos sobre a função info () neste artigo. A função de informação de pandas descreve o quadro de dados. Se resumissemos brevemente o artigo no primeiro exemplo, criaríamos um quadro de dados no qual pegamos três colunas "inteiros", "personagem" e "float_values". Temos alguns valores nessas colunas. Temos um índice com quatro entradas, variando de “0 a 3”. Usando o “df.informações.(verbose = true) ”A função exibirá completamente o resumo inteiro do quadro de dados. Um quadro de dados com algumas colunas é o que temos no segundo exemplo. Possui três entradas em nosso índice, numeradas “0 a 2”. A função “df.informações.(verbose = false) ”exibirá uma breve visão geral do código. Este artigo pode simplificar mais para você entender o método info () do panda ().