Os pandas soltam todas as colunas, exceto

Os dados devem ser limpos, estruturados e arrumados antes de iniciar qualquer análise. Para alcançar a seleção ideal de dados para uma avaliação ou apresentação específica, às vezes é necessário alterar um quadro de dados de pandas para eliminar colunas desnecessárias ou para otimizar o conjunto de dados para criação de modelos. Nos pandas, a modificação da coluna pode ocorrer em uma variedade de técnicas. Às vezes é complicado compreender como remover colunas de um quadro de dados. O comando "DataFrame Drop" é a chave. Usando o “df.Função Drop () ”, colunas especificadas podem ser descartadas. Neste guia, entenderemos como excluir colunas em um quadro de dados de pandas, exceto para os especificados.

Método Pandas Drop ()

O método Pandas "Drop ()" nos ajuda a descartar as colunas especificadas do quadro de dados fornecido, mantendo os selecionados no quadro de dados resultantes. Isso pode ser feito usando a seguinte sintaxe:

Veremos sua demonstração prática com os programas Python neste artigo.

Exemplo 1: Utilizando a função Pandas Drop () para soltar todas as colunas, exceto a coluna única especificada, no quadro de dados real

Este exemplo fará com que você entenda a execução prática do método Pandas "Drop ()" para eliminar todas as colunas em um quadro de dados, exceto as certas que escolheremos ser exibidas.

Precisaríamos de software ou uma ferramenta para compilar o programa que geraremos para o exemplo. Fora das escolhas, a que descobrimos ser a ferramenta mais adequada para nossas manifestações é a ferramenta "Spyder". Um novo arquivo de projeto é aberto na ferramenta e depois começamos o script. Carregamos o módulo necessário que é pandas aqui. A biblioteca de pandas foi importada para o arquivo python e é alias como "PD".

Precisamos então criar um quadro de dados usando o método do kit de ferramentas de pandas. Pandas tem um método muito simples “PD.Dataframe () ”para construir um DataFrame. Aqui "PD" é o alias para pandas, enquanto o "DataFrame", como o nome mostra, é a palavra -chave que chama o processo de criação de dados de dados. Chamamos esse método e o instruímos para criar um quadro de dados com 5 colunas. Especificamos os rótulos para as colunas, bem como fornecemos o mesmo comprimento dos valores para cada coluna.

Os rótulos que definimos para as colunas são "janeiro", "fevereiro", "março", "abril" e "maio". Os valores que armazenamos na coluna “Janeiro” são “1”, “2”, “3”, “4”, “3” e “5”. A coluna "fevereiro" tem valores "7", "8", "9", "10", "11" e "12". A "marcha" está segurando entradas como "13", "14", "15", "16", "17" e '18 ". Fornecemos valores à coluna "abril" como "19", "20", "21", "22", "23" e "24". A última coluna no DataFrame "May" está carregando esses valores "25", "26", "27", "28", "29" e "30". Fornecemos o mesmo tamanho de coluna para cada coluna no DataFrame.

Como você pode observar, cada coluna está segurando 6 valores. Se você alterar o comprimento de qualquer coluna dentro de um determinado quadro de dados, ela lhe dará um erro de comprimento desigual da coluna. Quando o “PD.A função DataFrame () ”é invocada com as colunas fornecidas, gerará um DataFrame. Agora, requer um objeto ou uma variável na qual ele possa colocar esse quadro de dados, por isso não será perdido. Além disso, sempre que precisamos trabalhar com esse quadro de dados em particular, podemos acessá -lo através do objeto que fornecemos para armazenar o quadro de dados. O objeto DataFrame que criamos aqui é chamado "meses". Nós atribuímos o resultado do “PD.DataFrame () ”Método.

A função "print ()" imprime o que você passará para ela. Nós fornecemos nosso objeto de dados de dados "meses" para exibir o conteúdo que preservou.

Executando o script Python acima elaborado apenas atingindo a tecla "Run File" coloca um quadro de dados com 5 colunas especificadas no console python para visualizar.

Agora, veremos como utilizar o método "Drop ()" para eliminar todas as colunas do quadro de dados, exceto uma certa coluna que manteremos no quadro de dados.

Nós invocamos o “df.Método Drop () ”fornecendo o“ df.colunas.Método () ”, juntamente com outros dois parâmetros“ eixo ”e o“ inplace ”. O ".O método de differência () ”nos fornece o complemento dos dados que entraremos como um parâmetro. Nesse caso, fornecemos a coluna "March". Quando o método "Drop ()" é invocado para descartar as colunas no quadro de dados "meses", ele manterá os valores da coluna "março".

O parâmetro "eixo" está definido como "1", que se refere às colunas. E o "inplace" é valorizado como "verdadeiro", que executará todas as alterações no quadro de dados originais sem fazer nenhuma cópia dele. Depois de chamar essa função, precisamos visualizar o quadro de dados atualizado. Empregamos o método "print ()" para exibir o quadro de dados real com conteúdo modificado na tela.

É assim que o nosso quadro de dados real agora se parece. Abaixamos todas as colunas, mas mantivemos a coluna "março" no quadro de dados atualizado.

Exemplo 2: Utilizando a função Pandas Drop () para soltar todas as colunas, exceto

Para esta demonstração, veremos como soltar todas as colunas, exceto as várias colunas selecionadas e fazer as alterações na cópia do DataFrame, em vez do quadro de dados reais.

Neste exemplo, utilizaremos o quadro de dados que construímos na instância acima. Depois de exibir o DataFrame, invocamos o método "Drop ()". Entre os parênteses do “df.função de solt () ”, chamamos de“ df.diferença () ”função e fornecemos duas colunas“ janeiro ”e“ março ”. Portanto, essas duas colunas serão mantidas no quadro de dados e todas as colunas restantes serão descartadas no quadro de dados “meses”. O parâmetro "eixo" é avaliado em "1". Isso dirá ao Python para aplicar a função em termos de linha.

Aqui, o terceiro parâmetro "inplace" é definido como "false". Manter isso "falso" significa que a função fará as alterações na cópia do DataFrame em vez do quadro de dados real. Para armazenar esta cópia modificada do DataFrame "meses", criamos uma variável "cópia". Essa variável manterá o quadro de dados atualizado depois de soltar todas as colunas, exceto as duas que especificamos que são "janeiro" e "março". Por fim, empregamos o método "print ()" para exibir o resultado do "df.Método Drop () ”no terminal, passando a variável“ cópia ”.

O método "print ()" nos apresenta dois dados de dados quando executamos o script python acima escrito. Aqui, o primeiro DataFrame exibido é o quadro de dados real sem nenhuma modificação, enquanto o segundo quadro de dados é a cópia do quadro de dados real depois de soltar todas as colunas, exceto as duas especificadas sendo exibidas.

Conclusão

Decidir quais dados manter e quais omitir ao analisar os conjuntos de dados é um conceito muito essencial para aprender. Neste artigo, elaboramos o “df.Drop () ”função com sua sintaxe. Implementamos este método na ferramenta Spyder. O primeiro exemplo ensina você a modificar o quadro de dados real, enquanto o segundo quadro de dados explica como fazer uma cópia do quadro de dados para manter as alterações.

Banco de dados Oracle

O Oracle Fusion considerado melhor que o SAP?

O Oracle Fusion (ERP baseado em nuvem) possui uma interface amigável, enquanto o SAP (nuvem e o loca...

Rickey Greenholt

Golang

O que são estruturas em Golang

Em Golang, uma estrutura é um tipo de dados composto que consiste em zero ou mais campos nomeados, c...

Salvatore Watsica

Golang

Introdução à linguagem de programação de Golang

Golang é uma linguagem de programação de código aberto desenvolvido pelo Google. Siga este artigo pa...

Pedro Macejkovic