Pandas DataFrame Selecione linhas por condição

Pandas DataFrame Selecione linhas por condição
“Em“ Python ”, temos uma biblioteca Open_source, que é a biblioteca“ pandas ”. Em "pandas", podemos realizar várias tarefas de maneira fácil e eficiente. Como sabemos que podemos criar quadros de dados em "pandas", utilizando os métodos "pandas". Então, depois de criar os quadros de dados, podemos selecionar linhas aplicando condições. Podemos utilizar métodos diferentes que "pandas" fornecem para selecionar as linhas do quadro de dados, dependendo da condição que adicionamos nos métodos "pandas". Discutiremos todos os métodos que podemos usar para selecionar as linhas no quadro de dados em "Pandas", neste guia.”

Métodos para selecionar linhas do quadro de dados por condição

O "Pandas" fornece quatro métodos diferentes para selecionar as linhas do quadro de dados por condição. Esses métodos estão aqui:

  • Quadro de dados.Método de Query ().
  • Quadro de dados.Método loc ().
  • Quadro de dados.Método ISIN ().
  • Quadro de dados.Método Filter ().
  • DataFarme.Método Iloc ().
  • Quadro de dados.Método Aplicar ().

Todos esses métodos são utilizados em "pandas" para selecionar as linhas do quadro de dados "pandas". Também colocamos a condição nesses métodos e eles selecionarão as linhas, dependendo dessa condição. Utilizaremos esses métodos e selecionaremos linhas neste guia e explicaremos cada código em detalhes aqui.

Exemplo # 01
A ferramenta que usaremos neste guia para desenvolver o código "pandas" é a ferramenta "Spyder". Geramos o código "Pandas" importando os módulos de "Pandas" e, em seguida, desenvolvemos uma lista chamada Lista "Matric_class", que tem "nome" que contém nomes dos alunos como "Peter, George, Bromley, Samuel, Leo , Farnham e Lily ”.

Depois disso, estamos adicionando algumas marcas desses alunos em diferentes disciplinas e essas disciplinas são "inglês, computador, física, química e biologia". Em "Inglês", adicionamos "46, 32, 54, 71, 68, 31 e 54", em "Computer", adicionamos "82, 23, 48, 34, 32, 15 e 33", depois Vem “Física”, na qual adicionamos “29, 31, 27, 55, 29, 20 e 32”, depois “química”, que contém “59, 32, 57, 85, 59, 55 e 81 ", A" biologia "é a próxima na qual as marcas são" 90, 31, 84, 95, 98, 72 e 77 ". Esta é a lista aninhada "matric_class".

Agora, temos que converter esta lista aninhada no quadro de dados; portanto, para esse fim, usamos o método "pandas", que também é mostrado abaixo "PD.Quadro de dados". Este método altera a lista "matric_class" no quadro de dados chamado "matric_class_df". Este "matric_class_df" é então colocado no método "print ()". Aqui, o DataFrame é concluído e também renderizado.

Agora, precisamos executar este código. Portanto, enquanto trabalhamos na ferramenta "Spyder", é por isso que pressionamos o ícone "Run" desta ferramenta de execução; Depois disso, o seguinte resultado é renderizado no qual o quadro de dados é renderizado. Agora, selecionaremos algumas linhas deste quadro de dados, utilizando o método "pandas", dependendo de algumas condições, que adicionaremos no método "pandas".

Aqui, estamos filtrando algumas linhas colocando o nome de dados de dados e a condição que adicionamos neste método é que o "nome" é igual a "Bromley", por isso será a linha em que o nome do aluno é "Bromley" e armazenar a linha "Bromley" em "Result_df". O resultado de "Bromley" agora é renderizado na tela colocando -o em "print ()".

A linha completa é mostrada aqui, que contém os dados do "Bromley". Filizamos esta linha do quadro de dados colocando a condição no método "pandas".

Exemplo # 02
Estamos usando o "matric_class_df" novamente, e aqui estamos selecionando linhas que não sejam "Bromley". Então, a condição que colocamos aqui é que o "nome" do aluno não é igual a "Bromley". Ele selecionará ou filtrará todas as linhas nas quais o nome do aluno não é "Bromley" e também renderiza todas as linhas, exceto a linha que contém o nome "Bromley" na coluna "nome".

Aqui, ele seleciona todas as linhas do quadro de dados originais, exceto a linha de 2 índice porque, nesta linha, a coluna "nome" contém "Bromley". Então, ele ignora essa linha e seleciona todas as outras linhas do quadro de dados e as torna aqui.

Exemplo # 03
Agora, estamos criando uma nova lista para o novo exemplo aqui em que a lista criada é o "abc_list". Na coluna "Nome", adicionamos "James, Milli, Farnham, Lily, Leo, Samuel e Fuller". Em seguida, temos os "códigos", nos quais inserimos "ABC19, ABC34, ABC39, ABC45, ABC59, ABC62 e ABC15". Depois vem o "mês", que contém "julho, abril, julho, agosto, setembro, julho e outubro". As “unidades” têm “19, 14, 9, 16, 15, 10 e 13”. Esta lista é convertida no quadro de dados e o quadro de dados é renderizado.

Depois disso, utilizamos o “DataFrame.método de query () ”para selecionar algumas linhas. Colocamos a condição que é "mês == julho", o que significa que ele seleciona todas as linhas nas quais o "mês" é "julho". Essas linhas são salvas em "ABC_DF2" e, em seguida, exibimos aquelas linhas que contêm o mês de "julho" usando "Print ()"

O DataFrame original contém 7 linhas e selecionamos as linhas nas quais o mês é "julho", portanto, apenas três linhas estão presentes nesse quadro de dados, que contém "julho", e essas três linhas também são renderizadas separadamente após o quadro de dados original.

Exemplo # 04
O quadro de dados criado neste exemplo é chamado de "paciente", contendo "nome, cidade, sitts_no e taxa/sentado" nele. Os nomes dos pacientes estão no "nome", que são "James, Noah, Peter, Bromley e Samuel". As cidades desses pacientes são inseridas em "City", que são "Nova York, Birmingham, Nova York, Los Angeles e Banglore". Em seguida, colocamos o número de sessões em "Sitts_no", que são "2, 6, 4, 4 e 3". Também inserimos a taxa por sentado desses pacientes, que são “6000, 6000, 6900, 7400 e 6300”.

Depois disso, a lista "paciente" também é alterada para o "paciente_df", que é o quadro de dados aqui. Em seguida, imprimimos “paciente_df” e, após a impressão, estamos mudando para utilizar o método “loc” aqui, o que nos ajuda a selecionar as linhas. A condição que estabelecemos aqui é que ele seleciona aquelas linhas nas quais os "Sitts_No" do paciente é "4" e também mostra aquelas linhas no terminal.

Apenas duas linhas estão lá no quadro de dados em que os “Sitss_no” do paciente é “4”, e você também pode observar essas linhas na saída abaixo.

Exemplo # 05
Agora, fornecemos outro exemplo aqui e criamos diretamente o DataFrame "professor_df" aqui, no qual as colunas que adicionamos são "Exam_Code, Examiner_Name, Examiner_Duty_Num, Exam_room_No e Exam_block". Também inserimos dados em todas as colunas da mesma maneira que explicamos em nossos códigos anteriores. Depois, também renderizamos "professor_df", aqui estamos filtrando linhas usando o método "isin ()". Inicializamos uma variável "Data" com "A e C" e depois colocamos os "dados" no método "isin ()" e também colocamos o nome da coluna no qual ele verifica esses valores de dados. O nome da coluna é "Exam_block" aqui, por isso verificará a coluna "Exam_block" e seleciona aquelas linhas nas quais o "Exam_block" é "A" ou "C" e, em seguida, imprima essas linhas em que essa condição é satisfeita.

Este método "isin ()" seleciona todas as colunas em que o "Exam_block" é "A" ou "C". Neste dataframe, apenas cinco linhas aparecem que satisfazem essa condição, e estas também são exibidas aqui.

Conclusão

Este guia apresenta o conceito de “selecionar as linhas de quadro de dados pela condição em pandas”. Discutimos métodos diferentes que são usados ​​para selecionar as linhas em pandas, dependendo de algumas condições. Utilizamos quatro métodos em nossos códigos aqui e também explicamos cada um deles em detalhes. Mostramos como colocamos a condição nesses métodos e como esses métodos retornam ou selecionam as linhas do quadro de dados. Discutimos que, quando colocamos a condição em qualquer método que explicamos aqui para selecionar as linhas, ela verifica essa condição e seleciona essas linhas do quadro de dados, que satisfaz a condição dada. Exibimos a saída junto com o script de código neste guia.