Pandas selecione Linha por valor

Pandas selecione Linha por valor
Linhas de um quadro de dados de pandas podem ser selecionadas com base em vários critérios ou valores da coluna. Este artigo fornece explicações e exemplos para as inúmeras abordagens para realizar isso
Confira os métodos anexos para esse fim:
  • Indexação booleana
  • LOC [] propriedade
  • Método de Query ()
  • Método ISIN ()

Vamos explorar a implementação prática dessas técnicas.

Criando um quadro de dados

Para a implementação dos exemplos, estamos utilizando a ferramenta Spyder. Após o lançamento da ferramenta, importamos a biblioteca necessária, que é "pandas" e alias a "PD". Agora, usando a função Pandas, primeiro criaremos um exemplo de frameframe que será usado em todas as ilustrações neste guia.

Nós invocamos o método pandas “PD.Dataframe () ”, que inicia o processo de criação de dados de dados. Nós inicializamos com 4 colunas "Marks", "st_name", "st_id" e "pontos". Cada coluna está armazenando uma lista de valores definidos. A coluna "Marks" está tendo os valores "100", "92", "79", "92", "73", "82" e "90". Para a coluna "st_name", temos valores de string "Adam", "Albert", "Elsa", "Ronald", "Maya", "George" e "Jessica". A coluna "st_id" está mantendo valores que definimos como "10", "11", "12", "13", "14", "15" e "16". Os valores “14”, “13”, “14”, “12”, “11”, “10” e “9” foram armazenados na coluna “Pontos”.

A duração dos valores para as colunas é 7 neste caso. O “PD.O método DataFrame () ”gerará um DataFrame com essas colunas e valores especificados. Agora, para armazenar esse quadro de dados, criamos um objeto DataFrame "Teste" e o atribuímos o resultado produzido ao invocar o método do construtor de dados de dados de pandas. A partir de agora, podemos acessar esse quadro de dados usando o objeto "teste" como um nome de dados de dados para todas as ilustrações. No final, o DataFrame é exibido na tela, utilizando o método de Python "Print ()".

O comando "Run File" nos apresentará o quadro de dados resultante apresentado no console python.

Exemplo 1: Selecionando linhas em um quadro de dados com base nos valores da coluna

O primeiro método, a selecionar linhas em um dataframe é a técnica de indexação booleana. Neste método, verificamos todas as fileiras como "verdadeiras ou falsas" no quadro de dados para uma condição de coluna definida específica. Qualquer linha (s) corresponde à condição que ela produz "verdadeiro" e será selecionada como saída.

A sintaxe deste método para executar o programa é:

Para aprender sua demonstração prática, vamos analisar essas etapas fáceis. Temos que scrip -lo como o nome do quadro de dados; operador subscrito; E dentro dos colchetes, escreva o nome e a condição da coluna. Nosso quadro de dados, como mencionamos acima, é "teste" e a coluna em que escolhemos aplicar a condição é "Marcas". Aplicamos uma condição para selecionar linhas onde o nome da coluna é "Marks" e seu valor é igual a "92". Então, simplesmente temos que extrair linhas com base no valor da coluna “Marks” “92”. Para salvar o resultado, uma variável foi gerada e chamada "manequim". Passaremos essa variável "manequim" para o método "print ()" para mostrar seu conteúdo no terminal quando ele for invocado.

A saída mostra 2 linhas que foram selecionadas do quadro de dados depois de verificar a condição. Você pode ver que a condição que especificamos era de linhas selecionadas onde as marcas são “92”. Aqui, temos 2 registros com todos os dados exibidos cujas marcas são "92". O primeiro é "Albert" e o segundo é "Ronald".

Exemplo 2: Selecionando linhas em um quadro de dados com base nos valores da coluna utilizando a propriedade LOC []

O segundo método que estamos usando para recuperar as linhas usando os valores da coluna é o “df.loc [] ”com o“ df.valores ”propriedade.

Nós utilizamos o “df.Propriedade dos valores ”para verificar uma condição. A coluna que selecionamos para verificar os valores é "st_name" do quadro de dados "teste". A condição que definimos aqui é selecionar a linha onde o valor da coluna "st_name" é igual a "ronald". Para armazenar o resultado, criamos uma variável "cópia". Portanto, esta propriedade verificará a condição e detectará as linhas que estão mantendo os dados necessários.

Em seguida, empregamos a propriedade "loc []" do DataFrame. O nome do DataFrame como "teste" com a propriedade "loc []" é fornecido. Entre os suportes quadrados deste atributo, passamos a variável "cópia" que está tendo as linhas que correspondem à condição especificada. O “df.A propriedade LOC [] ”simplesmente recuperará as linhas que a variável“ cópia ”está segurando. Para preservar o resultado, temos uma variável "dados". Para ver a saída final, o "imprimir()" O método é chamado com a variável "dados" como um parâmetro para exibir seu conteúdo.

Temos uma linha como a saída que atende à condição definida. Como existe apenas uma entrada com o valor "Ronald" na coluna "st_name" no DataFrame.

Exemplo 3: Selecionando linhas em um quadro de dados usando os valores da coluna utilizando o DF.Função de consulta ()

Outra técnica para filtrar linhas em um quadro de dados com base nos valores da coluna é usando o "consulta()" método. Este método aborda a expressão que retornará um valor booleano, verifica a condição em todas as linhas em um quadro de dados e retorna um quadro de dados apenas com as linhas que atendem à condição.

Nós invocamos o “df.Query () ”função. Aqui "DF" é o quadro de dados que é chamado "teste". Entre os parênteses do método, especificamos a condição. A expressão que definimos é de "st_id", onde o ID é igual a "10". A função "Query ()" extrairá todas as linhas no quadro de dados do "teste" que correspondem a esta condição. O resultado será salvo na variável "extrato". Finalmente, os dados armazenados na variável "Extrato" são exibidos chamando o método "print ()".

A tela de saída exibe uma única linha porque há apenas um registro associado ao "st_id" como "10". Você pode ver que o registro é encontrado no índice "0", que é a primeira linha no DataFrame.

Exemplo 4: Selecionando linhas em um quadro de dados usando os valores da coluna utilizando o método isin ()

A última estratégia que estamos discutindo aqui para selecionar linhas é o método "isin ()". É preciso uma série ou lista de valores e extrai linhas com base nos valores da lista.

Definimos uma lista de valores como "iteração" que está tendo esses valores: "Adam", "Elsa" e "George". O “df.A função isin () ”é invocada. O nome do DataFrame e o nome da coluna são fornecidos com o método "isin ()". Entre os aparelhos, a lista “iteração” é fornecida. Então, ele verificará a coluna de dados de "teste" "st_name" para os valores armazenados na lista. Se encontrar os valores, simplesmente retornará a linha selecionada. Preservamos o resultado da variável “armazenamento 'e a exibimos usando o método“ print () ”.

Isso nos produz três linhas que correspondiam aos valores na lista.

Conclusão

Selecionar linhas específicas por valores em um quadro de dados é uma técnica útil. Demonstramos uma variedade de métodos para recuperar as linhas com base nos valores da coluna. Primeiro fizemos você aprender a construção de um quadro de dados e depois elaboramos em 4 exemplos, utilizando estratégias diferentes para extrair linhas. Todas as ilustrações foram compiladas e executadas no Spyder.