Os pandas estão entre as ferramentas mais populares usadas hoje pelos cientistas de dados para analisar dados tabulares. Para lidar com o conteúdo tabular, ele oferece uma API mais rápida e eficaz. Sempre que vemos os quadros de dados durante a análise, os pandas definem automaticamente vários comportamentos de exibição para valores padrão. Esses comportamentos de exibição incluem quantas linhas e colunas para mostrar, a precisão dos carros alegóricos em cada quadro de dados, tamanhos de coluna, etc. Dependendo dos requisitos, ocasionalmente precisamos modificar esses padrões. Os pandas têm uma variedade de abordagens para alterar o comportamento padrão. Aproveitando o atributo "Opções" dos pandas nos permitiram mudar esse comportamento.
Os pandas exibem linhas máximas
Sempre que você tenta imprimir um enorme quadro de dados que contém mais linhas e colunas do que o limite predefinido, a saída será aparada. Para mostrar todas as linhas no quadro de dados, você aprenderá como modificar as opções de exibição dos pandas neste tutorial. Os pandas por padrão impõem um limite ao número de colunas e linhas que ele exibe. Embora isso possa ser útil para a leitura do conteúdo, freqüentemente causa frustração se as informações que você precisa visualizar não for mostrado. Aqui, usaremos os métodos fornecidos abaixo com a sintaxe para exibir todas as colunas do quadro de dados.
para sequenciar()
set_option ()
option_context ()
Aprenderemos a utilização de todos esses métodos com implementação prática para exibir linhas máximas no quadro de dados fornecido.
Exemplo # 1: Utilizando o método pandas to_string ()
Esta demonstração nos ensinará a exibir linhas máximas em um quadro de dados no terminal usando o método Pandas "to_string ()".
Para a compilação e execução dos programas de amostra, escolhemos a ferramenta "Spyder". Neste guia, usaremos esta ferramenta para a execução de todos os nossos exemplos. Lançamos a ferramenta "Spyder" para começar a escrever o script python. Começando com o código, primeiro precisamos carregar as bibliotecas necessárias em nosso arquivo python para que tenhamos permissão para usar seus recursos. A biblioteca de módulos que precisamos aqui é o "pandas". Então, nós o importamos para o nosso arquivo python e o alias para "PD".
Como a operação principal deste artigo é exibir as linhas máximas de um quadro de dados, primeiro precisamos de um quadro de dados. Agora cabe a você se você prefere gerar um quadro de dados ou importar um arquivo CSV. Nós importamos um arquivo CSV de amostra. Para ler um arquivo CSV no programa Python, utilizamos os pandas “PD.Função read_csv () ”. Entre os parênteses desta função, fornecemos o arquivo CSV que queremos ler a tela, que é “Indústria.CSV ”. Construímos uma variável "df" para armazenar a saída gerada pela leitura do arquivo CSV fornecido. Em seguida, invocamos o método "print ()" para exibir o quadro de dados.
Quando executamos este programa Python pressionando a opção "Run File", um DataFrame é exibido no console. Você pode observar que existem 43 linhas no resultado abaixo, mas apenas dez são exibidos. Isso ocorre porque o valor padrão da biblioteca de pandas é de apenas 10 linhas.
Usaremos o método pandas "to_string" para exibir todas as linhas aqui. A maneira mais direta de mostrar linhas máximas de um quadro de dados é com esta técnica. No entanto, como transforma o quadro de dados completo em uma única string, ele não é recomendado para conjuntos de dados muito grandes (nos milhões). No entanto, isso funciona efetivamente para conjuntos de dados que estão na duração de milhares.
Seguimos a sintaxe fornecida acima para a função "to_string ()". Simplesmente invocamos o método "to_string ()" com o nome de nosso quadro de dados. Em seguida, colocamos esse método na função "print ()" para exibi -lo quando chamado.
O instantâneo de saída nos mostra um quadro de dados com todas as linhas sendo exibidas no terminal.
Exemplo # 2: Utilizando o método de Pandas Set_Option
O segundo método que praticaremos neste guia é o Pandas "Set_Option ()" para exibir as linhas máximas do DataFrame fornecido.
No arquivo python, importamos a biblioteca de pandas para acessar a função mencionada acima. Usamos os pandas “PD.read_csv () ”para ler o arquivo CSV fornecido. Invocamos o “PD.Função read_csv () ”com o nome do arquivo CSV que queremos usar entre seus parênteses, que é“ Sampledata.CSV ”. Ao importar o arquivo CSV, mantenha o diretório de trabalho atual do programa Python em mente. Seu arquivo CSV deve ser colocado no mesmo diretório; Caso contrário, você receberá uma mensagem de erro "arquivo não encontrado". Criamos uma variável "amostra" para armazenar o quadro de dados do arquivo CSV. Chamamos o método "Print ()" para mostrar este DataFrame.
Aqui, temos nossa saída onde apenas dez linhas são exibidas. O número máximo de linhas indicado é 99. Todas as outras linhas entre os primeiros 5 e as últimas linhas são truncadas.
Para exibir as linhas máximas que são 99 para este DataFrame, usaremos a função "Set_Option ()" do módulo pandas. Os pandas vêm com um sistema operacional que permite alterar o comportamento e exibir. Este método nos permite definir a tela para exibir um quadro de dados completo em vez de truncado. Os pandas fornecem a função "set_ option ()" para exibir todas as linhas do quadro de dados.
Nós invocamos o “PD.set_option () ”. Esta função tem parâmetros “Display.max_rows ”. A “exibição.max_rows ”Especifica o número máximo de linhas que serão exibidas ao exibir um quadro de dados. O valor de "max_rows" é definido como 10 por padrão. Se 'nenhum' for selecionado, isso significa todas as linhas no quadro de dados. Como queremos exibir todas as linhas, então o definimos como "nenhum". Por fim, usamos a função "print ()" para exibir o quadro de dados com max linhas.
Isso produz o resultado fornecido no instantâneo abaixo.
Exemplo # 3: Utilizando o método Pandas Option_Context ()
O último método que estamos discutindo aqui é o "Option_Context ()" para exibir todas as linhas do DataFrame. Para isso, importamos o pacote de pandas para o arquivo python e começamos a escrever o código. Nós usamos o “PD.Função read_csv () ”para ler o arquivo CSV que especificamos. Criamos uma variável "dalta" para armazenar o quadro de dados do arquivo CSV especificado. Em seguida, simplesmente imprimimos o quadro de dados com o método "print ()".
O resultado que obtivemos ao executar o código acima nos mostra um quadro de dados com linhas truncadas.
Agora vamos aplicar os pandas “PD.Option_Context () ”Neste DataFrame. Esta função é idêntica a "Set_Option ()". A única diferença entre as duas abordagens é que "Set_Option ()" altera as configurações permanentemente, enquanto "Opção _Context ()" apenas as mudou dentro de seu escopo. Este método também exibe.Max linhas como um parâmetro, que definimos para "nenhum" para renderizar todas as linhas do quadro de dados. Depois de invocar esta função, acabamos de exibi -la através do método "print ()".
Aqui, podemos ver o quadro de dados completo com suas linhas máximas que são 2747.
Conclusão
Este artigo se concentra nas opções de exibição dos pandas. Às vezes, podemos precisar visualizar o quadro de dados completo no terminal. Os pandas nos dão uma variedade de opções para esse fim. Neste guia, usamos três dessas estratégias. O primeiro exemplo foi baseado no uso do método "to_string ()". Nossa segunda instância nos ensina a implementar o "Set_Option ()" enquanto a última ilustração executa o método "option_context ()". Todas essas técnicas são demonstradas para torná -lo familiarizado com as maneiras alternativas de que os pandas nos fornecem para alcançar o resultado necessário.