PANDAS AGG CONTA

PANDAS AGG CONTA
Em "Pandas", podemos criar os quadros de dados que contêm as robinas_and_columns. Grandes quantidades de dados tabulares são geralmente explorados e organizados usando o programa Pandas. "Pandas" nos fornece vários métodos e um deles é a "contagem", podemos ver quantos valores existem para cada coluna em seu quadro de dados usando o método de contagem.

O método de contagem é utilizado para localizar colunas incompletas. A partir daí, você pode optar por pular as colunas em seus processos ou, se necessário, dar a eles valores padrão. Neste guia, examinaremos os pandas e value_counts, que são duas maneiras de avaliar seu quadro de dados.

Exemplo # 01

Começamos utilizando o aplicativo "Spyder". Isso nos ajudará a fazer os códigos "pandas". Em seu editor de texto, iniciamos nosso primeiro código importando os “pandas como PD”. Este "PD" é utilizado para acessar os métodos "pandas" que queremos. Agora, não precisamos escrever o nome completo "pandas" para acessar sua função. Em vez disso, apenas escrevemos "PD".

Em seguida, criamos uma variável e também a inicializamos adicionando alguns dados. Adicionamos os dados na coluna, definindo o primeiro nome da coluna como "nomes" e os nomes que adicionamos aqui são "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" , e "Rick". A próxima coluna é nomeada "Assuntos", que contém nomes de sujeitos como "Matemática", "Economia", "Ciência", "Matemática", "Estatísticas", "Estatísticas", "Estatísticas" e "Computador".

Abaixo da variável, criamos "número" e utilizamos o "PD.DataFrame () ”Método. Usamos o "PD" para obter o método Pandas "DataFrame". Mudamos os dados de "cursos" no "DataFrame" e atualizamos seu nome como "número". Então, o método "print ()" ajuda a exibir o quadro de dados. Abaixo disso, primeiro utilizamos o método "groupby ()". Isso nos permite dividir seus dados em muitas categorias para que você possa executar cálculos para uma análise mais completa. “Grupoby” este dados de dados colocando “assuntos” e depois utilizamos o método “count ()”.

A função count () fornece uma entidade em série com o resultado para cada linha depois de contar o número de valores não vazios para cada linha. Colocamos os dois métodos na função "print ()" para que ela seja exibida no terminal.

Ele exibe os assuntos originais do DataFrame primeiro e depois “Groupby” e conta o número do sujeito. Ele também adiciona os mesmos assuntos e o escreve aqui. Neste DataFrame, duas colunas contêm o assunto "Matemática", para que ele exibe o assunto "Matemática" "2" e o assunto "estatística" "3".

Exemplo # 02

Agora, importamos “pandas” e, em seguida, geramos dados e armazenamos esses dados na variável “Data123”. Temos colunas "funcionários" e "endereços" aqui. Em "funcionário", inserimos nomes de funcionários que são "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" e "Rick". No "endereço", colocamos os endereços dos funcionários que são "Londres", "America", "Sodan", "London", "Sodan", "Sodan", "America" ​​e "America".

Em seguida, declaramos e também inicializamos "o mesmo", que é um nome variável e inicializamos com "PD.Quadro de dados". Também passamos o parâmetro "Data123" para este "PD.Quadro de dados". Estamos utilizando o método "value_count ()" abaixo. A técnica de contagem de valor é melhor. Esta técnica fornecerá o número total de valores distintos para uma determinada coluna. Damos a coluna "endereço" aqui.

Temos o nome do quadro de dados que é "mesmo" e adicione o nome da coluna que é "endereço". Em seguida, escreva a função ou método "value_count ()". Adicionamos esta declaração completa dentro do método "print ()", para que ele também renderize na tela do console.

Depois de renderizar o quadro de dados nesse resultado, ele conta os mesmos endereços dos funcionários e os exibe abaixo e remove o nome dos funcionários ou remove a coluna "funcionário". Ele apenas mostra o endereço e seus números que estão presentes neste quadro de dados.

Exemplo # 03

Os dados aqui são inseridos em cinco colunas. Criamos um quadro de dados chamado "estudantes" e as colunas que temos são "roll_no", "s_name", "s_instructor", "s_course" e "credit_hrs". Na coluna "roll_no", temos "A1, A2, A3, A4 e A5". Agora, na próxima coluna "S_NAME", estamos adicionando os nomes dos alunos "Smith, Noah, Joseph, Mishi e William". Então, estamos colocando os nomes dos instrutores: “Peter, Taylor, James, Robert e Olivia”. Os cursos que estamos inserindo aqui são “inglês, britânico, inglês, árabe e inglês”.

Para a coluna "credit_hrs", adicionamos "4, 5, 4, 3 e 4" a ela. Alteremos todos esses dados no quadro de dados e nomeamos esse quadro de dados ou armazenamos esse quadro de dados na variável "estudantes". Em seguida, empregamos "print ()", que renderiza este DataFrame. Abaixo disso, colocamos os métodos "Groupby ()" e "Count ()". E coloque "s_couse" para que conta os cursos e os exibe.

Temos 1 curso "árabe", 1 curso "britânico" e 3 cursos de "inglês" aqui neste DataFrame. Temos essa contagem aplicando o método "count ()".

Exemplo # 04

Neste exemplo, o DataFrame criado contém o "upload_date", no qual adicionamos algumas datas que são adicionadas a cinco datas. Em seguida, insira outra coluna "Viewer_ids", na qual adicionamos os IDs dos espectadores como "V1, V2, V3, V4 e V5". Damos o nome "vídeo" para este DataFrame. Use "Groupby" primeiro, que agrupa os dados com base em "upload_date" e depois usa o "count ()", que contará esses dados com base em "upload_time". Finalmente, exiba o resultado.

Este é o resultado deste código e conta os dados com base no "tempo de upload" dos vídeos. Os vídeos que são enviados em "2022-07-21" são dois na contagem total.

Exemplo # 05

O "estudo" é a variável que contém dados que estão nos formulários de coluna e linha. Os nomes das colunas são “cursos, c_fee e c_duration”. A coluna “Cursos” possui “Pandas, Ubuntu, Linux, Python, Pandas, Linux, Spark, Python, Ubuntu, Python e Python”. A coluna “C_FEE” contém “22000, 25000, 23000, 24000, 26000, 25000, 25000, 22000, 25000, 24000 e 24000”. A coluna “c_duration” contém dados que são “30 dias, 50 dias, 35 dias, 40 dias, 60 dias, 35 dias, 30 dias, 50 dias, 50 dias, 40 dias e 40 dias”.

Altere -os no DataFrame e também imprima o DataFrame. “Groupby ()” os “Cursos e C_Duration” e conte -os aplicando “count ()”. Esses métodos "Groupby" e "Count" agruparão os dados com base nas colunas para cursos e duração. Em seguida, calcule a contagem.

Aqui, agrupa os dados sobre os cursos e sua duração e depois conta esses cursos utilizando o método "count ()".

Conclusão

Este guia está no conceito da função "AGG" em "Pandas.”Descrevemos como a função“ agg contagem ”em pandas é usada para contar. O método "agg contagem" foi aplicado às cinco instâncias que estabelecemos.