Pyspark - Pandas Series representa a série Pandas, mas mantém a coluna Pyspark internamente.
A estrutura de dados da série Pandas suporta e os pandas são importados do módulo Pyspark.
Antes disso, você deve instalar o módulo Pyspark.”
Comando
pip install pysparkSintaxe para importar
De Pyspark Import pandasDepois disso, podemos criar ou usar a série do módulo pandas.
Sintaxe para criar a série Pandas
Pyspark.Pandas.Series()Podemos passar uma lista ou lista de listas com valores.
Vamos criar uma série de pandas através do Pyspark que possui cinco valores numéricos.
#import pandas do módulo PysparkSaída
Agora, entraremos em nosso tutorial.
As funções agregadas são usadas para executar operações de agregação como Sum (), Min (), Mean () e Max ().Essas operações funcionam apenas em dados numéricos como número inteiro, duplo, etc
Vamos vê -los um por um.
Pyspark.Pandas.Series.soma()
Sum () na série Pyspark Pandas é usado para retornar a soma total.
Sintaxe
Pyspark_series.soma()Onde Pyspark_series é a série Pyspark Pandas.
Exemplo
Retornar a soma da série Pyspark Pandas acima.
Saída:
278Pyspark.Pandas.Series.significar()
média () na série Pyspark Pandas é usada para retornar a média total.
Sintaxe
Pyspark_series.significar()Onde Pyspark_series é a série Pyspark Pandas.
Exemplo
Média de retorno da série Pyspark Pandas acima.
Saída
55.6Pyspark.Pandas.Series.min ()
min () na série Pyspark Pandas é usado para retornar o valor mínimo.
Sintaxe
Pyspark_series.min ()Onde Pyspark_series é a série Pyspark Pandas.
Exemplo
Retorne o valor mínimo da série Pyspark Pandas acima.
Saída
0Pyspark.Pandas.Series.max ()
Max () na série Pyspark Pandas é usado para retornar o valor máximo.
Sintaxe
Pyspark_series.max ()Onde Pyspark_series é a série Pyspark Pandas.
Exemplo
Retorne o valor máximo da série Pyspark Pandas acima.
Saída
90Conclusão
Neste tutorial da série Pyspark Pandas, vimos quatro funções de agregação diferentes executadas na série. Sum () retornará a soma total, o avg () é usado para retornar a média total, min () é usado para retornar o valor mínimo e max () retornará o valor máximo.