Pyspark - Pandas Series representa a série Pandas, mas mantém a coluna Pyspark internamente.
A estrutura de dados da série Pandas suporta e os pandas são importados do módulo Pyspark.
Antes disso, você deve instalar o módulo Pyspark.”
Comando
pip install pysparkSintaxe para importar
De Pyspark Import pandasDepois disso, podemos criar ou usar a série do módulo pandas.
Sintaxe para criar a série Pandas
Pyspark.Pandas.Series()Podemos passar uma lista ou lista de listas com valores.
Vamos criar uma série de pandas através do Pyspark que possui cinco valores numéricos.
#import pandas do módulo PysparkSaída
Agora, entraremos em nosso tutorial.
Operações cumulativas são usadas para retornar resultados cumulativos entre os valores da série Pyspark Pandas.
Vamos vê -los um por um.
Pyspark.Pandas.Series.Cumsum ()
Cumsum () retornará a soma cumulativa da série para cada elemento. Pode ser aplicado a toda a série Pyspark Pandas.
Sintaxe
Pyspark_series.Cumsum ()Onde Pyspark_series é a série Pyspark Pandas
Exemplo
Neste exemplo, realizaremos uma operação de soma cumulativa na série.
Saída
Trabalhando:Pyspark.Pandas.Series.cumprod ()
Cumprod () retornará o produto cumulativo da série para cada elemento. Pode ser aplicado a toda a série Pyspark Pandas.
Sintaxe
Pyspark_series.cumprod ()Onde Pyspark_series é a série Pyspark Pandas
Exemplo
Neste exemplo, realizaremos uma operação cumulativa de produto na série.
Saída
Trabalhando:Pyspark.Pandas.Series.Cummin ()
Cummin () retornará o valor mínimo cumulativo da série para cada elemento. Pode ser aplicado a toda a série Pyspark Pandas.
Sintaxe
Pyspark_series.Cummin ()Onde Pyspark_series é a série Pyspark Pandas
Exemplo
Neste exemplo, realizaremos uma operação Min cumulativa na série.
Saída
Trabalhando:Pyspark.Pandas.Series.Cummin ()
Cummin () retornará o valor mínimo cumulativo da série para cada elemento. Pode ser aplicado a toda a série Pyspark Pandas.
Sintaxe
Pyspark_series.Cummax ()Onde Pyspark_series é a série Pyspark Pandas
Exemplo
Neste exemplo, realizaremos uma operação máxima cumulativa na série.
Saída
Trabalhando:Conclusão
Neste tutorial de Pyspark Pandas, discutimos operações cumulativas realizadas na série Pyspark Pandas. Cumsum () é usado para devolver a soma cumulativa, Cumprod () é usado para retornar o produto cumulativo em, Cummin () é usado para retornar o valor mínimo cumulativo, e Cummax () é usado para retornar o valor máximo cumulativo.