Pandas conta linhas com condição

Pandas conta linhas com condição
Os pandas estão entre as ferramentas de ciência de dados e aprendizado de máquina mais amplamente adotadas para limpeza e processamento de dados. Pode ser necessário adquirir várias linhas presentes no quadro de dados enquanto utiliza o quadro de dados do pandas para armazenar e analisar seus dados. Para o processo de manuseio de dados, você pode precisar contar rapidamente as ocorrências das mesmas entradas ou diferentes entradas em todo o seu conjunto de dados ou, em particular, linhas que cumprem qualquer condição de qualquer condição.

Os pandas nos permitem determinar a forma de um dados de dados contando o número de linhas, bem como colunas no quadro de dados. Você pode empregar uma variedade de métodos para entender o conceito para contar o número de linhas e colunas em pandas. Estes incluem "len ()", "df.forma [0] "," df [df.colunas [0]].count () ”,“ df.count () ”e“ df.size () ”métodos. O mais rápido desses métodos é Len (), que vamos olhar neste tutorial.

Vamos começar a aprendê -lo praticamente implementando os códigos de exemplo.

Utilizando o método Pandas Len ()

A técnica que implementaremos nesta ilustração é o método "len ()". Vamos explorar como está funcionando.

Todos os códigos de exemplo que usaremos neste tutorial são implementados e executados em Python, utilizando a ferramenta "Spyder". A primeira tarefa é instalar e executar a ferramenta "Spyder" na sua área de trabalho ou laptop. Depois de terminar o processo de instalação, abrimos a ferramenta e abrimos um novo arquivo que possui um “.Py ”extensão. Aqui, "Py" representa "Python". Antes de começarmos a escrever nosso código, precisamos adicionar alguns pré -requisitos. Como o título do nosso artigo nos diz brevemente que quaisquer técnicas que usaremos devem ser suportadas pela biblioteca "pandas".

Portanto, precisamos adicionar uma biblioteca de pandas escrevendo o script “Importar pandas como PD”. Agora importamos a biblioteca de pandas e declaramos que os pandas agora podem ser acessados ​​escrevendo "PD" em vez da forma completa "pandas" ao longo do programa. Avançando, criamos um quadro de dados de pandas onde exercemos a técnica de pandas escolhida. Para a construção de um DataFrame, os pandas nos fornecem um método muito simples e útil “PD.Dataframe () "em que" pd "refere -se a" pandas "e" dataframe "é a palavra -chave usada para criar o quadro de dados.

Empregamos este método em nosso script. Entre seus parênteses, inicializamos três colunas. O título da nossa primeira coluna é "Grupo", que armazena oito valores de cordas que são "x", "x", "x", "x", "y", "y", "y" e "y". A segunda coluna no quadro de dados é "POS", que também armazena 8 valores de string. Esses valores são "AU", "Bo", "Bo", "Bo", "Au", "Au" e "Bu". A última coluna aqui é "pontuações" e possui oito valores inteiros, eu.e. "19", "23", "18", "15", "15", "12", "21" e "28". Quando geramos um DataFrame, também precisamos criar uma variável ou um objeto de quadro de dados para armazenar esse quadro de dados.

Aqui, a variável que criamos para o referido objetivo é "res". Em seguida, atribuímos esta função à saída gerada ao invocar o “PD.DataFrame () ”Método. Agora, para ver esse quadro de dados, criamos no terminal que usamos a função "print ()" que exibe a saída. Vamos executar este script Python:

Para exibir a saída exibida no terminal, clique no botão "Executar arquivo" na ferramenta "Spyder". Aqui está o nosso quadro de dados inicial:

Utilizando o método len () com uma condição

Agora, temos que contar as linhas da coluna especificada no quadro de dados que atendem à condição fornecida. Primeiro, aplicaremos a condição em uma única coluna para recuperar o número de linhas que correspondem à condição. Em seguida, o aplicamos às várias colunas do DataFrame. Para ambas as técnicas, utilizamos o método "len ()" dos pandas. A sintaxe para este método para aplicar as condições em uma única coluna é fornecida no seguinte:

De acordo com a sintaxe, invocamos o método "len ()" que conta o número de linhas. Dentro de seus aparelhos, especificamos uma condição com o nome do DataFrame e o nome da coluna DataFrame. Selecionamos a coluna "Grupo" do nosso quadro e especificamos uma condição para isso. A condição diz para verificar se algum valor da coluna "grupo" é igual a "x". Sempre que a condição é comparada, o método "len ()" conta a linha que a contém.

Agora, para armazenar esse valor contado de linhas que cumpriram a condição, criamos uma variável "contagem". Utilizamos o método "print ()" para mostrar um texto no terminal antes das linhas contadas. Com o objetivo de ver a saída das linhas contadas exibidas, empregamos novamente a função "print ()" e fornecemos a variável "contagem" como o parâmetro.

Temos nosso quadro de dados e as linhas contadas que correspondem à condição exibida no terminal. Podemos observar que o DataFrame possui linhas “4” que correspondem à condição. Você também pode verificá -lo comparando -o com o DataFrame anterior. A coluna "Grupo" possui 4 valores "X", por isso é calculado pelo método Pandas "Len ()".

Utilizando o método len () com várias condições

Contamos o número de linhas com a condição para uma única coluna no exemplo anterior. Agora, aprenderemos a contar as linhas para duas colunas. A sintaxe segue é:

Explicando essa sintaxe, a função "len ()" é chamada para contar o número de linhas que atendem às condições. Então, mencionamos o nome do quadro de dados cujas linhas queremos contar. Agora, o nome da primeira coluna com a condição específica, depois o nome da segunda coluna do quadro de dados com a condição especificada. Entre essas duas condições está o operador "&". Este operador é chamado de operador "e". Quando se virá entre duas declarações condicionais, isso significa que as linhas só serão contadas se as duas condições forem atendidas.

Em nossa ilustração, selecionamos a coluna "Grupo" e a coluna "POS". Aplicamos as condições a ambas as colunas. A condição na coluna "Grupo" verifica os valores nesta coluna em particular que são iguais a "y". Considerando que a condição em "POS" verifica os valores iguais a "bo". O operador "&" verifica os valores da saída de ambos os valores e verifica a condição. Então, precisamos do número de linhas que têm o valor do "grupo" "X" e o "POS" igual a "bo".

Criamos outra variável "cal". Quando as condições são verificadas, a função "len ()" conta o número de linhas e a armazena na variável "resultado". Por fim, empregamos dois métodos "print ()", um para exibir um texto enquanto o outro para imprimir as linhas contadas pela função "len ()" armazenada na variável "cal".

A imagem de saída a seguir anexada nos mostra que existem apenas 3 linhas no quadro de dados que atendem à condição especificada. Da coluna "Grupo" e "POS", apenas três linhas são recuperadas que têm "X" "Grupo" e o "POS" é "bo". Dê alguns segundos para verificar por si mesmo se a saída gerada estiver correta examinando o quadro de dados exibido no seguinte instantâneo:

Você aprendeu a aplicar as condições em duas colunas. Agora, aplicá -los em várias colunas não o causará em problemas. Agora aplicamos as condições em todas as três colunas do quadro de dados e obtemos apenas a contagem daquelas linhas que atendem a todas as três condições.

A primeira condição é aplicada na coluna "Grupo" para verificar os valores iguais a "y". Então, os valores do "grupo" que são "y" e o "POS" é "bo". E a última condição que inclui as condições completas declara o "grupo" igual a "y" e o "POS" é "bo" e as "pontuações" são maiores que "15". Recuperar esses registros do DataFrame. O "Len ()" conta as linhas e as armazena na variável "resultado". Utilize o método "print ()" para exibir a saída.

A saída nos diz que existem 2 linhas no quadro de dados que atendem às três condições.

Conclusão

Os pandas nos fornecem uma variedade de recursos muito úteis e importantes. Este tutorial é baseado no método fornecido por pandas. Esta é a função "len ()" para contar o número de linhas em um determinado dataframe. Nesse aprendizado, nosso objetivo e objetivo é fazer você entender como você pode contar o número de linhas que cumprem uma condição definida. Explicamos todas as etapas dessa técnica explicitamente verbalmente e com a ajuda de códigos de exemplo que foram implementados na ferramenta "Spyder". Colocamos uma tentativa sincera de tornar essa peça de escrita o mais fácil e útil possível para você entender o conceito.