Pandas Groupby Sum

Pandas Groupby Sum
Os pandas fornecem uma variedade de recursos úteis para nos ajudar a converter os dados no formato desejado. Um deles é a função do grupo que divide as fileiras de um quadro de dados em grupos com base nos valores de colunas específicas. Os pandas são a melhor ferramenta para este caso, pois podem lidar com a natureza imprevisível dos dados reais. O método "Groupby ()" do Python para Pandas é uma ferramenta sofisticada e útil. Ele permite dividir seus dados em vários grupos e executar os cálculos para uma análise mais precisa.

Método Pandas Sum ()

A soma dos valores para o eixo solicitada pelo usuário é retornada pela função SUM (). Se o valor de entrada for um eixo de indexação, todos os valores nessa coluna são adicionados. Isso se aplica a todas as colunas. Isso resulta em uma série que contém o total dos valores de cada coluna. Você pode usar diretamente o método Pandas Sum () nas colunas escolhidas da saída do grupo pandas para obter a soma ou total de cada grupo. Este método calcula a soma de linhas e colunas da entrada.

Método Pandas Groupby Sum ()

Existem algumas etapas seguintes para encontrar o Pandas Groupby Sum ():

  • Crie um tipo de dados bidimensional, tamanho grande e pode conter grandes conjuntos de dados.
  • Exibir a entrada do DataFrame, DF.
  • Usando o DF. Grupoby Sum (), encontre o grupo Sum (). Esta função classifica os valores em uma determinada coluna. Os valores das outras colunas são então classificados, dependendo dos valores classificados.
  • A soma para o grupo.

Sintaxe para o Método Groupby Sum ()

Esta sintaxe básica é usada para calcular a soma dos valores na função do grupo ().

Exemplo 1: Crie um objeto de grupo usando o DataFrame

Precisamos de um software ou ferramentas para nos dar uma plataforma onde podemos executar este programa para colocar em prática o exemplo de Códigos Python. Assim, a ferramenta "Spyder" é usada. Devemos abrir um novo arquivo quando a interface aparecer. Na interface da ferramenta "Spyder", escolhemos a opção "novo arquivo" para executar o código. Também nos oferece opções adicionais para abrir os arquivos. Portanto, você também pode abri -lo usando o "Ctrl+N".

Devemos importar esses "pandas como PD" para executar o código dos pandas. A seção "PD" do código instrui o Python a atribuir aos pandas o alias de "PD.Quadro de dados.groupby () ”como um nome de função como dataframe“ groupby () ”. Usando o grupo, agrupamos o quadro de dados do pandas. A função Gouper escolhe a coluna necessária. Usando um mapeador ou um conjunto de colunas, a função Groupby () agrupa um DataFrame e retorna um objeto de grupo. Grandes quantidades de dados nesses grupos podem ser combinadas ou transformadas aplicando uma variedade de métodos e funções personalizadas em objetos de grupo por grupo.

Criamos um quadro de dados cujo tamanho é "6, 2" e seus nomes de colunas são "alfabeto" e "valor". Neste exemplo, as variáveis ​​que tomamos são "K", "L" e "M" e seus valores são "36", "21", "42", "8", "9" e "3". Para aplicar as funções agregadas, o método "Groupby ()" de Pandas agrupa os dados semelhantes em um grupo. Este método retorna um objeto de grupo de dados que tem métodos agregados como soma e outros semelhantes. O "df.Groupby (["alfabeto"] ", por exemplo, adiciona todas as colunas de valor em um quadro de dados e calcula suas somas. O uso do “grupo.O método count () ”é obter a contagem de cada grupo, ignorando os valores de nenhum e nan para agrupar as linhas por coluna. Além disso, ele funciona com dados de tipo que não flutuam. Com a contagem dos valores para cada grupo em um grupo, construa uma nova série ou dataframe.

Neste código, usamos o “grupo.soma()". Esta função classifica os valores em uma determinada coluna. Os valores das outras colunas são então classificados, dependendo dos valores classificados. Isso cria uma tabela cujos nomes de colunas são "alfabetos" e "valores" do alfabeto que está escrito abaixo do alfabeto e escreva seus valores na frente deles. Usando o “grupo.sum () ”, os alfabetos semelhantes combinam seus valores e os fazem soma. Usando o “grupo.sum () ”, os alfabetos semelhantes combinam seus valores e os fazem soma.

Depois de executar o código, mostrou seu resultado no qual o “grupo.A função count () ”criou uma tabela contando os“ alfabetos ”e“ valores ”. Na linha seguinte, coleta os alfabetos semelhantes e resume seus grupos usando o “grupo.sum () ”função. Agora, o valor para "K" é "99", o valor de "L" é "17" e o valor para "M" é 3.

Exemplo 2: Encontre e soma a velocidade de alguns animais usando a função do grupo Sum ()

Este cenário também é comparável ao primeiro. Para as funções que usamos no exemplo anterior, também usamos o mesmo neste código. Para isso, criamos um quadro de dados que possui duas colunas. O nome para uma coluna é "animal" e o outro é "velocidade".

Neste código, também temos as mesmas funções que tivemos no programa anterior - o “grupo.count () "e" Grupo.soma()". A soma de cada grupo pode ser obtida usando o método Pandas "Sum ()" diretamente nas colunas selecionadas da saída do grupo pandas. O DataFrame representa a função Pandas Dataframe. Na lista de animais, pegamos três animais - "macaco", "leão" e "tigre". Na segunda coluna, escrevemos sua velocidade. O DataFrame é dividido em grupos usando o método "DataFrame Groupby ()". Ele calcula o número de contagens de dados semelhantes que estão presentes em uma coluna específica de dados de dados.

Usando o “df.groupby () ”, o objeto é dividido, uma função é aplicada e os produtos são combinados. Uma grande quantidade de dados pode ser agrupada usando isso e as operações podem ser calculadas nesses grupos. Você pode agrupar seus dados com o método "groupby ()" e executar as operações nesses grupos. O grupo.função count () ”retorna o número total de valores não-NAN. Um DataFrame é retornado se houver várias colunas. Contar é a técnica agregada mais simples fundamental. A aplicação da função Count Pandas a todo o quadro de dados de animais revela rapidamente quantos "macacos", "leões" e "tigres" estão lá no grupo "animal".

Examine os resultados do arquivo de origem, execute este código e forneça uma saída veriosa. Esta saída exibe três tabelas usando três funções diferentes. Se contarmos a velocidade de três "macacos", será "105". A velocidade para dois "leões" é "160" e a velocidade de um "tigre" é "65".

Conclusão

Considerando essas informações, este artigo serve como um exemplo da idéia e necessidade de simplificar as coisas para você. Definimos duas funções aqui. Estas são as aplicações para o “grupo.sum () ”e“ grupo.Conde ”funciona em pandas. Você provavelmente pode entender o quão incrível e útil o “grupo.sum () ”e“ grupo.As funções da contagem () ”são para examinar os dados. Neste tutorial, vimos como combinar os mesmos dados usando o “df.grupo ”e ​​somando -os. Fornecemos a este guia uma explicação boa e simples de todos os métodos, para que seja mais fácil para você obter nosso ponto. Você pode escolher uma das duas técnicas disponíveis com base em suas necessidades, mas dominar ambos é essencial e, portanto, melhora suas habilidades em Python pandas.