Pandas de produtos cumulativos

Pandas de produtos cumulativos
O Python é uma linguagem de programação de alto nível fácil de usar para executar a análise de dados. A principal razão para isso é que o Python fornece um grande ecossistema de pacotes centrados em dados como pandas. Os pandas em Python simplificam importar e analisar os dados.

Uma das funções do panda é série.cumprod (). Este método é usado para calcular o produto cumulativo de uma série. Neste artigo, explicaremos como calcular o produto cumulativo usando a biblioteca do Panda em Python.

O que é um produto cumulativo?

Um produto cumulativo é um produto iterativo de cada elemento em uma matriz. Uma determinada sequência é iterativamente multiplicada por cada elemento nessa sequência. Todo valor resultante é a soma dos valores atuais e anteriores da matriz. Por exemplo, temos uma sequência de 3 elementos [x, y, z], e o produto cumulativo será [x, xy, xyz].

Os pandas em Python fornecem algumas funções para calcular o produto cumulativo de uma série. Cumprod () é uma daquelas funções comumente usadas para encontrar o produto cumulativo de uma série em Python. Um quadro de dados ou série de elementos fornecidos à função Cumprod () calcula o produto cumulativo e retorna o mesmo tamanho de DataFrame ou série que contém o produto cumulativo.

Qual é a sintaxe da série.Método Cumprod ()?

Aqui está a sintaxe da série.Método Cumprod ():

As séries.Cumprod () leva dois parâmetros; eixo e skipna. O valor para o eixo é 0 ou 1; ou é índice ou coluna, 0 e índice, ambos representam a operação emoção, enquanto 1 e a coluna representam a operação em coluna. Além disso, o valor Skipna é um valor booleano (verdadeiro ou falso). É usado para pular os valores de Na em um DataFrame. As séries.Cumprod () retorna o mesmo tamanho da série que a entrada.

Agora, vamos prosseguir com os exemplos para ver como podemos implementar a função cumprod () em python.

Exemplo 1

Neste exemplo, criaremos uma pequena série de números que também contêm um valor de Na. O valor de Na é mantido na série para ver como Cumprod () reage a ele. Além disso, nenhum valor é fornecido para o parâmetro skipna, tornando o Cumprod () use o valor padrão do skipna true true. Veja o código abaixo.

Como discutido anteriormente, o produto cumulativo é o produto do valor atual e todos os valores anteriores na matriz. O primeiro item da matriz original é sempre igual ao primeiro produto cumulativo. O segundo valor é o produto dos primeiros e segundos valores, 2 * 3 = 6, e o terceiro valor é o produto dos três primeiros valores, 2 * 3 * 5 = 30.

Agora, se o quarto valor for nan, o skipna era verdadeiro, o que fez com que o Cumprod () pule o valor de Na e siga em frente, retornando na NA para o valor atual. O mesmo processo do produto cumulativo é seguido para o restante dos valores na matriz.

importar pandas como PD
importar numpy como np
num = [2, 3, 5, NP.nan, 7, 9, 1, 0]
s = pd.Série (NUM)
Cumprod = s.cumprod ()
Imprimir (Cumprod)

Veja a seguinte saída para conhecer o produto cumulativo de cada valor na matriz:

Exemplo 2

No exemplo anterior, não fornecemos o valor para Skipna, mantendo o skipna verdadeiro por padrão. Agora, forneceremos falsos para Skipna para que Cumprod () não pule na e possamos ver o que acontecerá nesse caso.

Ao fornecer o valor falso para Skipna, estamos forçando o Cumprod () a perceber o valor de Na a qualquer momento e compará -lo sempre em sua ocorrência. Consulte o código a seguir para aprender como fornecer um valor falso para o parâmetro Skipna:

importar pandas como PD
importar numpy como np
num = [2, 3, 5, NP.nan, 7, 9, 1, 0]
s = pd.Série (NUM)
Cumprod = s.Cumprod (skipna = false)
Imprimir (Cumprod)

Aqui está a saída do código anterior:

Observe que os quatro primeiros valores são os mesmos do exemplo anterior. No entanto, o quinto valor se torna Na como fornecemos skipna = false, o que significa que Na não é ignorado e comparado quando ocorreu na lista. Assim, fazendo todos os valores restantes na.

Exemplo 3

Vimos o produto cumulativo de uma matriz simples nos exemplos anteriores. Vejamos como podemos calcular o produto cumulativo de uma matriz, dependente do eixo. Este exemplo fornecerá duas colunas em uma matriz e encontrará seu produto cumulativo. Aqui está o código para isso:

importar numpy como np
arr = np.Array ([[1, 3, 5, 7], [2, 4, 6, 8]]))
print ("A matriz de entrada é =", arr)
res = np.Cumprod (arr)
print ("O produto cumulativo da matriz de entrada é =", res)

Observe que a matriz resultante é a soma do comprimento de ambas as colunas, que é 4 + 4 = 8. Veja a saída abaixo:

Exemplo 4

Agora, sabemos que é possível calcular o produto cumulativo de uma matriz com base no eixo, podemos decidir se queremos calcular o produto cumulativo de todo o eixo ou apenas o 1 eixo ao mesmo tempo. Veja o código abaixo para saber como podemos conseguir isso.

Como você pode observar, fornecemos apenas o parâmetro de eixo adicional à função Cumprod (). O valor do parâmetro do eixo é 1, o que significa calcular o produto cumulativo de 1 eixo. Em palavras simples, o cumprod () pega a primeira coluna, calculará seu produto cumulativo e devolverá o resultado. Depois disso, pegue a segunda coluna, inicie o novo produto cumulativo, calcule o produto cumulativo de cada elemento e retorne o resultado da segunda coluna.

importar numpy como np
arr = np.Array ([[1, 3, 5, 7], [2, 4, 6, 8]]))
print ("A matriz de entrada é =", arr)
res = np.Cumprod (arr, eixo = 1)
print ("O produto cumulativo da matriz de entrada é =", res)

Aqui está a imagem de saída:

Conclusão

Cobrimos o conceito fundamental de calcular o produto cumulativo neste artigo. Também mencionamos diretrizes sobre como calcular o produto cumulativo usando pandas em python. Os pandas em Python fornecem uma função cumprod () para calcular o produto cumulativo de uma série.