Vamos explorar a implementação prática dessas técnicas.
Criando um quadro de dados
Para a implementação dos exemplos, estamos utilizando a ferramenta Spyder. Após o lançamento da ferramenta, importamos a biblioteca necessária, que é "pandas" e alias a "PD". Agora, usando a função Pandas, primeiro criaremos um exemplo de frameframe que será usado em todas as ilustrações neste guia.
Nós invocamos o método pandas “PD.Dataframe () ”, que inicia o processo de criação de dados de dados. Nós inicializamos com 4 colunas "Marks", "st_name", "st_id" e "pontos". Cada coluna está armazenando uma lista de valores definidos. A coluna "Marks" está tendo os valores "100", "92", "79", "92", "73", "82" e "90". Para a coluna "st_name", temos valores de string "Adam", "Albert", "Elsa", "Ronald", "Maya", "George" e "Jessica". A coluna "st_id" está mantendo valores que definimos como "10", "11", "12", "13", "14", "15" e "16". Os valores “14”, “13”, “14”, “12”, “11”, “10” e “9” foram armazenados na coluna “Pontos”.
A duração dos valores para as colunas é 7 neste caso. O “PD.O método DataFrame () ”gerará um DataFrame com essas colunas e valores especificados. Agora, para armazenar esse quadro de dados, criamos um objeto DataFrame "Teste" e o atribuímos o resultado produzido ao invocar o método do construtor de dados de dados de pandas. A partir de agora, podemos acessar esse quadro de dados usando o objeto "teste" como um nome de dados de dados para todas as ilustrações. No final, o DataFrame é exibido na tela, utilizando o método de Python "Print ()".
O comando "Run File" nos apresentará o quadro de dados resultante apresentado no console python.
Exemplo 1: Selecionando linhas em um quadro de dados com base nos valores da coluna
O primeiro método, a selecionar linhas em um dataframe é a técnica de indexação booleana. Neste método, verificamos todas as fileiras como "verdadeiras ou falsas" no quadro de dados para uma condição de coluna definida específica. Qualquer linha (s) corresponde à condição que ela produz "verdadeiro" e será selecionada como saída.
A sintaxe deste método para executar o programa é:
Para aprender sua demonstração prática, vamos analisar essas etapas fáceis. Temos que scrip -lo como o nome do quadro de dados; operador subscrito; E dentro dos colchetes, escreva o nome e a condição da coluna. Nosso quadro de dados, como mencionamos acima, é "teste" e a coluna em que escolhemos aplicar a condição é "Marcas". Aplicamos uma condição para selecionar linhas onde o nome da coluna é "Marks" e seu valor é igual a "92". Então, simplesmente temos que extrair linhas com base no valor da coluna “Marks” “92”. Para salvar o resultado, uma variável foi gerada e chamada "manequim". Passaremos essa variável "manequim" para o método "print ()" para mostrar seu conteúdo no terminal quando ele for invocado.
A saída mostra 2 linhas que foram selecionadas do quadro de dados depois de verificar a condição. Você pode ver que a condição que especificamos era de linhas selecionadas onde as marcas são “92”. Aqui, temos 2 registros com todos os dados exibidos cujas marcas são "92". O primeiro é "Albert" e o segundo é "Ronald".
Exemplo 2: Selecionando linhas em um quadro de dados com base nos valores da coluna utilizando a propriedade LOC []
O segundo método que estamos usando para recuperar as linhas usando os valores da coluna é o “df.loc [] ”com o“ df.valores ”propriedade.
Nós utilizamos o “df.Propriedade dos valores ”para verificar uma condição. A coluna que selecionamos para verificar os valores é "st_name" do quadro de dados "teste". A condição que definimos aqui é selecionar a linha onde o valor da coluna "st_name" é igual a "ronald". Para armazenar o resultado, criamos uma variável "cópia". Portanto, esta propriedade verificará a condição e detectará as linhas que estão mantendo os dados necessários.
Em seguida, empregamos a propriedade "loc []" do DataFrame. O nome do DataFrame como "teste" com a propriedade "loc []" é fornecido. Entre os suportes quadrados deste atributo, passamos a variável "cópia" que está tendo as linhas que correspondem à condição especificada. O “df.A propriedade LOC [] ”simplesmente recuperará as linhas que a variável“ cópia ”está segurando. Para preservar o resultado, temos uma variável "dados". Para ver a saída final, o "imprimir()" O método é chamado com a variável "dados" como um parâmetro para exibir seu conteúdo.
Temos uma linha como a saída que atende à condição definida. Como existe apenas uma entrada com o valor "Ronald" na coluna "st_name" no DataFrame.
Exemplo 3: Selecionando linhas em um quadro de dados usando os valores da coluna utilizando o DF.Função de consulta ()
Outra técnica para filtrar linhas em um quadro de dados com base nos valores da coluna é usando o "consulta()" método. Este método aborda a expressão que retornará um valor booleano, verifica a condição em todas as linhas em um quadro de dados e retorna um quadro de dados apenas com as linhas que atendem à condição.
Nós invocamos o “df.Query () ”função. Aqui "DF" é o quadro de dados que é chamado "teste". Entre os parênteses do método, especificamos a condição. A expressão que definimos é de "st_id", onde o ID é igual a "10". A função "Query ()" extrairá todas as linhas no quadro de dados do "teste" que correspondem a esta condição. O resultado será salvo na variável "extrato". Finalmente, os dados armazenados na variável "Extrato" são exibidos chamando o método "print ()".
A tela de saída exibe uma única linha porque há apenas um registro associado ao "st_id" como "10". Você pode ver que o registro é encontrado no índice "0", que é a primeira linha no DataFrame.
Exemplo 4: Selecionando linhas em um quadro de dados usando os valores da coluna utilizando o método isin ()
A última estratégia que estamos discutindo aqui para selecionar linhas é o método "isin ()". É preciso uma série ou lista de valores e extrai linhas com base nos valores da lista.
Definimos uma lista de valores como "iteração" que está tendo esses valores: "Adam", "Elsa" e "George". O “df.A função isin () ”é invocada. O nome do DataFrame e o nome da coluna são fornecidos com o método "isin ()". Entre os aparelhos, a lista “iteração” é fornecida. Então, ele verificará a coluna de dados de "teste" "st_name" para os valores armazenados na lista. Se encontrar os valores, simplesmente retornará a linha selecionada. Preservamos o resultado da variável “armazenamento 'e a exibimos usando o método“ print () ”.
Isso nos produz três linhas que correspondiam aos valores na lista.
Conclusão
Selecionar linhas específicas por valores em um quadro de dados é uma técnica útil. Demonstramos uma variedade de métodos para recuperar as linhas com base nos valores da coluna. Primeiro fizemos você aprender a construção de um quadro de dados e depois elaboramos em 4 exemplos, utilizando estratégias diferentes para extrair linhas. Todas as ilustrações foram compiladas e executadas no Spyder.