Pandas DataFrame Groupby

Pandas DataFrame Groupby
Para agrupar os dados em categorias e aplicar uma função às categorias, utilizamos o método Pandas "Groupby ()". A agregação eficaz de dados também é auxiliada por ela. A função groupby () é utilizada para dividir os dados em grupos com base em alguns critérios específicos. Objetos de "pandas" podem ser divididos em qualquer eixo. Podemos dizer que em um método "groupby ()", o objeto é dividido, uma função é aplicada e seus resultados são combinados. Dados grandes podem ser agrupados usando o método "groupby ()", e as operações também podem ser calculadas nesses grupos. Este guia explicará o método "groupby ()" em detalhes e fornecerá diretrizes adequadas sobre o método "Groupby ()".

Exemplo # 01:

Também implementamos essa função "groupby ()" no código "pandas" neste guia, para que você aprenderá mais rapidamente sobre a função "groupby ()". Nós importamos os “pandas como PD” primeiro na ferramenta “Spyder” e depois geramos uma lista chamada “dados” aqui e inserir algumas informações nela. Colocamos o nome "Team" como o cabeçalho da coluna e as equipes que adicionamos a ela são "Cavaleiros, pilotos, demônios, demônios, reis, reis, reis, reis, pilotos, realeza, realeza, pilotos". A próxima coluna que criamos aqui é a coluna "Ano", na qual adicionamos dados do ano como “2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2014”.

Agora, esta é a nossa lista, e estamos mudando esta lista de "dados" para o DataFrame. Então, para isso, utilizamos o “PD.DataFrame () ”, que converte esta lista no DataFrame“ pandas ”. O DataFrame criado aqui é armazenado na variável "DF" e a imprimimos colocando o "DF" como o parâmetro de "print ()". Agora, o principal objetivo de escrever este código é implementar o método "groupby ()" nesses dados. Utilizamos o método "Groupby ()" e o aplicamos ao "ano". Isso agrupará os dados com base nos anos em que inserimos. Após o agrupamento, aplica o método "count ()" a este grupo. Ele contará os mesmos anos e depois os armazenará em "DF1". Depois disso, temos a "impressão" que renderá isso.


Para obter a saída, basta clicar no botão "Executar" no aplicativo "Spyder". O DataFrame que contém equipes e anos é renderizado primeiro e depois agrupa os mesmos anos, conta e exibe o número da contagem em frente a cada grupo do grupo. À medida que agrupa o ano "2014" e exibe "5", o que significa que o ano "2014" aparece cinco vezes neste DataFrame. Esse agrupamento é feito porque utilizamos o método "groupby ()" nesse quadro de dados.

Exemplo # 02:

Depois de importar os "pandas como PD", geramos diretamente o quadro de dados com o nome "Animals" e ele contém duas colunas: "Animal" e "Max Speed". A coluna "animal" possui "Sparrow, Falcon, Parrot, Parrot, Sparrow e Falcon". A coluna “Max Speed” contém “210, 30, 37, 24, 260 e 390”. Ele cria um quadro de dados contendo essas colunas à medida que utilizamos o “PD. DataFrame () ”Método aqui.

Em seguida, exibimos esse quadro de dados "animal". Depois disso, aplicamos o método "groupby ()" ao quadro de dados "Animals" e inserimos a coluna "animal" como o parâmetro. Isso tornará os grupos dependentes dos mesmos nomes de animais. Em seguida, também utilizamos a função "Mean ()" aqui, que encontrará a média daqueles grupos que são criados aqui, e inicializamos a variável "grupo" com esse método "Groupby ()", então o resultado que obtemos após o agrupamento será armazenado nele. Também queremos mostrar o resultado que é armazenado em "Grupo"; portanto, para isso, utilizamos novamente a função "print ()".


Os animais e suas velocidades máximas são exibidas no primeiro quadro de dados sem agrupar. Depois disso, a função "groupby ()" é aplicada aqui e agrupa todos os animais com o mesmo nome e depois encontra sua média e os exibe abaixo.

Exemplo # 03:

Estamos criando uma nova lista neste código, que é a lista "Summer_Courses", e adicionando quatro colunas exclusivas a ele. Os nomes de cabeçalho das colunas são “sujeitos, sub_fee, dias e dis_amount”. Também adicionamos os nomes de sujeitos, taxas de assunto, duração do curso em dias e valor do desconto na taxa nessas colunas. No "assunto", acrescentamos aqui estão "Desenvolvimento da Web, Wengineinging, CSS, HTML, CSS, Desenvolvimento da Web, CSS, HTML e também NA". O "sub_fee" contém a taxa que é "22000, 25000, 23000, 24000, 25000, 26000, 25000, 25000, 22000 e 15000". Os dias em que entramos aqui são “30, 50, 55, 40, 60, 35, 30, 50 e 40”, e também a coluna “Dis_amount” contém “1000, 2300, 1000, 1200, 2500, nenhum, 1400, 1600 e 0 ”.

Agora, temos que mudar esta lista para o DataFrame. Então, para converter a lista em dataframe, utilizamos o “PD.DataFrame () ”função e nomeie o DataFrame“ Summer_Course_DF ”. Também renderizamos "Summer_Course_DF" aqui. A variável "Summer_Course1" é inicializada usando a técnica "groupby ()" para que os resultados do agrupamento sejam salvos nele. O método "groupby ()" é então aplicado à coluna "Assunto".

Como resultado, grupos baseados em nomes de assuntos semelhantes serão criados. A função “sum ()” é então usada para calcular a soma dos grupos de sujeitos que foram formados. Esta “soma ()” calcula a soma das taxas, dias e valores de desconto para os mesmos assuntos. Também queremos exibir o resultado que foi salvo em "Summer_course1", então mais uma vez fazemos uso da função "print ()".


Aqui, você pode notar que ele renderiza todos os assuntos separadamente no primeiro dadoframe. Em seguida, ele combina os mesmos assuntos ou faz grupos dos mesmos nomes de assuntos e também exibe o mesmo nome. Ele aplica a função da soma aos Sub_fee, Days e Dis_amount colunas dos mesmos nomes de sujeitos e torna suas somas aqui.

Exemplo # 04:

Neste código, utilizamos o quadro de dados do exemplo anterior, mas aqui estamos executando a função "groupby ()" em várias colunas. Passamos dois nomes de colunas para a função "groupby ()", que são "sujeitos" e "dias". Em seguida, coloque o "sum ()", que realizará o somatório nos grupos que são criados aqui e salve -os na variável "Summer_Coursses2". Depois disso, renderizamos o "Summer_CourSses2" no final.


Esse resultado mostra que ele executa a função "groupby ()" nas colunas "Assunto" e "Days" e torna o resultado aqui após o agrupamento.

Conclusão:

Você pode fazer uso deste guia para estudar como utilizar a função "Groupby ()" em "Pandas" e também aprender sobre a sintaxe desse método "Groupby ()" aqui. Nosso principal objetivo é lhe dar uma explicação concisa e compreensível da idéia do método "Groupby ()" em "Pandas". Explicamos que esse método nos ajuda a fazer grupos, dependendo de alguns critérios específicos. Fizemos quatro exemplos neste guia em que fabricamos grupos utilizando o método "Groupby ()" em "Pandas". Depois de ler este tutorial, você terá um grau modesto de conhecimento, do qual poderá avançar para um estágio superior.