Pandas cair uma linha

Pandas cair uma linha
Ao lidar com conjuntos de dados Python, os engenheiros limpam os dados conforme necessário para a tarefa. A função de queda é freqüentemente utilizada para eliminar colunas e linhas que podem não ser relevantes para a tarefa.

Função de queda de pandas:

O método "Drop ()" no quadro de dados do pandas remove os rótulos fornecidos das colunas e linhas. A função Drop () elimina linhas e colunas, especificando nomes de etiquetas, bem como eixos correspondentes ou fornecendo os índices ou nomes de colunas explicitamente.

Quando utilizamos multi-índice, eliminamos os rótulos em vários níveis, indicando o nível. É utilizado para remover o quadro de dados, que não precisamos incluir em nossa análise.

A sintaxe para esta função é a seguinte:


A função "Drop ()" contém sete parâmetros no total, alguns dos quais são opcionais. Vamos discutir brevemente todos os parâmetros.

O primeiro parâmetro “Rótulos” é o índice ou melhor, o nome da coluna que deve ser eliminado. Geralmente é especificado para ser um único rótulo ou uma lista. O "eixo" tem dois valores possíveis: 0 e 1. Quando precisamos cair do índice/linha, escrevemos 0 no parâmetro e, se tivermos que remover das colunas, colocamos 1. Está definido como 0 por padrão. "índice" pode ser usado em vez de especificar o eixo (rótulos, eixo = 0 é igual ao índice = rótulos).

O próximo parâmetro é “Colunas”. É usado para especificar colunas. Índices e colunas são equivalentes ao eixo que não pode ser usado em conjunto. “Níveis” é um argumento opcional para o uso de múltiplasindex e especifica o nível do qual os rótulos seriam descartados. "no lugar" é um argumento booleano de que, se verdadeiro, desempenha a função no lugar e retorna nenhum. Sua configuração padrão é falsa. O último parâmetro é “Erros”. Quando está configurado para "ignorar", apenas rótulos preexistentes são descartados e o erro é ignorado. Tem dois valores possíveis. O primeiro é "ignorar", enquanto o segundo é "Raise". Por padrão, ele está definido como "criado".

Neste artigo, demonstraremos a você sua implementação prática com códigos de exemplo. Vejamos como podemos fazer isso em Python.

Exemplo # 1: Utilizando o método Pandas Drop () para soltar uma única linha por índice

Aprenderemos nesta ilustração para lançar uma única linha pelo índice do DataFrame fornecido usando o Pandas “DataFrame.Drop () ”Método.

Para iniciar a implementação prática do código Python para implementar o “DataFrame.Função de Drop () ”em Pandas Data Frames, devemos primeiro escolher uma boa ferramenta ou software que possa executar nossos programas Python. Aqui selecionamos e baixamos a ferramenta "Spyder". Instalamos a configuração da ferramenta "Spyder" e depois lançamos a ferramenta. Depois de ver a interface da ferramenta “Spyder”, abra um novo arquivo clicando na opção “Novo arquivo” ou pressionando as teclas “Ctrl+N”. Ele lançará um novo arquivo python com a extensão “.py ", que se refere a" python ". Agora temos tudo pronto para trabalhar.

O código principal começa com o carregamento das bibliotecas necessárias no programa Python. Como o título do nosso artigo descreve, vamos trabalhar em alguns módulos em "pandas". Então, a partir disso, conseguimos entender que nosso pré-requisito para implementar este código é importar a biblioteca "pandas" para o arquivo python. Para conseguir isso, temos que escrever um script python “Importar pandas como PD”. Isso nos permitirá usar os recursos dos pandas em nosso programa e nos permite acessá -los usando "PD" em vez de "pandas" sempre. Agora temos que criar um quadro de dados de pandas. Pandas nos com um método muito simples para criar um quadro de dados, que é “PD.Quadro de dados()".

Aqui, "PD" é pandas e "dataframe" é a palavra -chave para criar um quadro de dados. Construímos um quadro de dados que contém três colunas: "Produto", "Custo" e "Quantidade". Todas essas colunas receberam alguns valores. A coluna "Produto" possui valores de string que são "telefone", "laptop", "cpu", "impressora", "mouse", "teclado" e "alto -falante". As colunas “Custo” armazenam o número inteiro “5000”, “7000”, “4300”, “8150”, “1050”, “2150” e “1500”. A última coluna, "Quantidade", detém valores "3", "2", "1", "5", "1", "2" e "4". Lembre -se de criar o quadro de dados de que todas as colunas em um quadro de dados devem ter o mesmo tamanho ou comprimento dos valores.

Então, temos todas as colunas de comprimento sete. Para armazenar esse quadro de dados, criamos um objeto de quadro de dados “Eletrônica” e atribuímos a saída gerada ao invocar o “PD.DataFrame () ”função. Por fim, para exibir esse quadro de dados, utilizamos o método "print ()", dando ao objeto "Eletrônica" como seu parâmetro, para que agora imprima qualquer conteúdo armazenado dentro deste objeto de quadro de dados.


Para a execução do programa Python acima escrito, temos que pressionar o botão "Run File" na ferramenta "Spyder", ou você também pode pressionar as teclas "Shift+Enter" para executar o script. Temos um quadro de dados com três colunas e sete valores sendo exibidos no terminal.


A partir daqui, nossa principal tarefa começa. Agora temos que aprender como podemos soltar uma única linha por índice usando o pandas “DataFrame.Drop () ”Método. Simplesmente temos que fornecer o nome do quadro de dados que criamos acima com o “.Drop () ”” função e, como precisamos soltar uma linha, portanto, o parâmetro que usamos aqui é “índice”. Fornecemos o número do índice "3", que queríamos eliminar do quadro de dados. Isso excluirá a linha inteira com "índice = 3".

Para armazenar a saída desta função, criamos uma variável "new_electronics". Chamamos o método "print ()" para exibir um texto especificado entre seus parênteses e, em seguida, exibimos o quadro de dados atualizado armazenado na variável "New_electronics", invocando o método "print ()".


A execução do trecho de código acima mencionado nos receberá um quadro de dados atualizado depois de soltar a 3ª linha do quadro de dados gerado anteriormente.


Nesta imagem de saída, você pode ver que a terceira linha é eliminada do quadro de dados.

Exemplo #2: Utilizando o método Pandas Drop () para soltar várias linhas por índice

Já aprendemos a eliminar uma única linha do quadro de dados usando o Pandas “DataFrame.Drop () ”Método. Agora veremos o que podemos fazer se tivermos que descartar mais de uma linha do quadro de dados. Para esta ilustração, usamos o quadro de dados criado no exemplo acima. Trabalharemos diretamente na tarefa principal, pois todas as outras coisas foram explicadas na instância acima. Para soltar várias linhas, utilizamos o “DataFrame.Drop () ”funcionam como“ Eletrônica.solt () ”, que é o nome do nosso quadro de dados criado anteriormente.

Usamos o parâmetro "índice" e atribuímos os números de índice que queremos cair do quadro de dados como "index = [1, 3, 5]", o que significa que precisávamos descartar as linhas "1", "3" e "5" do quadro de dados. Simplesmente chamamos o método "print ()" para exibir o quadro de dados atualizado.


Isso nos dá a seguinte saída, onde as linhas 1, 3 e 5 são eliminadas do quadro de dados.

Conclusão:

Este guia descreve e elabora o módulo Pandas “DataFrame.soltar () ”para soltar linhas do quadro de dados. Definimos e explicamos brevemente os diferentes parâmetros desta função. Apresentamos você ao conceito de soltar uma única linha por índice do quadro de dados, bem como a exclusão de várias linhas por índice. Implementamos os dois conceitos praticamente com códigos Python na ferramenta "Spyder" e exibimos os quadros de dados resultantes gerados a partir dos programas. Esta peça de escrita é apenas um guia, mas sua prática com códigos práticos fará com que seja sua habilidade.