Este artigo foi projetado para fazer você aprender a encontrar porcentagens cumulativas em Python usando pandas. Vamos começar com a fórmula básica ou sintaxe da porcentagem cumulativa e depois prosseguir.
Qual é a sintaxe da porcentagem cumulativa?
Abaixo está a sintaxe da porcentagem cumulativa que você pode seguir.
Pandas porcentagem cumulativa
Os quadros de dados de pandas em Python fornecem duas funções predefinidas, SUM () e Cumsum (), para calcular a porcentagem cumulativa com o Python. A função SUM () é usada para calcular a soma de todos os valores na coluna, e a função Cumsum () é usada para calcular a soma cumulativa de cada valor na coluna.
Como funciona a função Cumsum () para calcular a soma cumulativa em Python?
O Cumsum () é um quadro de dados do Python embutido Panda usado para calcular a soma cumulativa dos elementos da matriz. É preciso uma matriz como entrada e calcula uma sequência de somas parciais ou, em outras palavras, um total em execução. O principal objetivo de calcular uma soma cumulativa é atualizar a soma de um conjunto de dados cada vez que um novo valor é adicionado ao conjunto de dados.
Existem cinco etapas que você deve seguir para calcular a soma cumulativa com pandas em Python, e aqui estão eles:
Agora vamos ver alguns exemplos para entender como Cumsum () e Sum () trabalham para calcular a porcentagem cumulativa da coluna com um quadro de dados de pandas no Python.
Exemplo 1:
No primeiro exemplo, começaremos a calcular a soma cumulativa de apenas uma coluna para que você possa entender a função facilmente. Primeiro, crie um quadro de dados como 'data_frame' e forneça os valores necessários para calcular a soma cumulativa e depois passe o parâmetro 'data_frame' para PD.Dataframe () enquanto especifica os valores da coluna e, finalmente, use as funções internas Cumsum () e Sum () para calcular a porcentagem cumulativa.
Aqui está a saída do código acima:
Exemplo 2:
Neste exemplo, mostraremos a soma cumulativa em cada etapa. O código é exatamente o mesmo que o exemplo acima, com algumas pequenas modificações para imprimir a soma cumulativa em cada etapa. Veja o código de amostra fornecido abaixo:
Aqui está a saída. Observe que a soma cumulativa é mostrada na coluna 'soma cumulativa' de cada valor. E o total de todos os valores é 1097. Veja a última linha da saída.
Exemplo 3:
Vimos como calcular a porcentagem cumulativa de uma coluna de uma só vez. Agora vamos ver como calcular a soma de duas colunas simultaneamente. O procedimento segue as mesmas etapas que os exemplos acima.
Primeiro, você precisa criar um quadro de dados e depois fornecer as colunas nas quais você precisa calcular a soma cumulativa. Em seguida, encontre a soma e a soma cumulativa com Sum () e Cumsum () função interna, respectivamente, e multiplique os valores por 100. Agora imprima os valores no quadro de dados para ver a saída. O código é fornecido abaixo:
importar pandas como PDA saída do código acima é o seguinte:
Exemplo 4:
Neste exemplo, explicaremos como lidar com os valores 'nan' em uma matriz? E como Cumsum () lida com os valores 'nan' no quadro de dados. Os passos iniciais são os mesmos que os dados nos exemplos; No entanto, as etapas adicionais são fornecidas abaixo no código:
A saída mostrará uma coluna de índice agora:
Se você perceber, há uma coluna adicional 'índice' adicionada ao quadro de dados. O próximo passo é encontrar a soma cumulativa que calculamos nos exemplos acima.
data_frame ['soma cumulativa'] = data_frame.Mathscore.Cumsum ()Aqui está a soma cumulativa antes de fornecer um valor 'nan':
Depois disso, vamos soltar um valor na matriz e substituí -lo pelo valor 'nan'. Veja o código abaixo para descobrir como substituir um valor por 'nan'.
data_frame = data_frame.Drop ('soma cumulativa', eixo = 1)Como você pode ver na saída abaixo, o valor no índice 3 é substituído por 'nan':
Vamos calcular a soma cumulativa novamente para ver como Cumsum () responde ao valor 'nan' na matriz.
data_frame ['soma cumulativa'] = data_frame.Mathscore.Cumsum ()Aqui está a saída da nova soma cumulativa.
Se você perceber que Cumsum () ignorou a 'nan' e calculou a soma cumulativa de todos os outros valores. Além disso, o valor total também é diferente como o valor único na matriz é 'nan' e não contribui para o valor total.
Conclusão:
Este artigo foi projetado para aprender a encontrar a porcentagem cumulativa com o quadro de dados de pandas no Python. Primeiro, discutimos a fórmula matemática básica de porcentagem cumulativa e, em seguida, vimos as duas funções python embutidas, Cumsum () e Sum (), para encontrar a porcentagem cumulativa com pandas em Python. A soma cumulativa é o total de uma sequência de somas parciais. Com a ajuda de exemplos, mostramos como usar a função Cumsum () e Sum () Python embutida para calcular a soma cumulativa de uma coluna.