Pyspark - Pandas Series representa a série Pandas, mas mantém a coluna Pyspark internamente.
A estrutura de dados da série Pandas suporta e os pandas são importados do módulo Pyspark.
Antes disso, você deve instalar o módulo Pyspark.”
Comando
pip install pysparkSintaxe para importar
De Pyspark Import pandasDepois disso, podemos criar ou usar a série do módulo pandas.
Sintaxe para criar a série Pandas
Pyspark.Pandas.Series()Podemos passar uma lista ou lista de listas com valores.
Vamos criar uma série de pandas através do Pyspark que possui cinco valores numéricos.
#import pandas do módulo PysparkSaída
Agora, entraremos em nosso tutorial.
Operações aritméticas são usadas para executar operações como adição, subtração, multiplicação, divisão e módulo. A série Pyspark Pandas suporta funções internas usadas para executar essas operações.
Vamos vê -los um por um.
Pyspark.Pandas.Series.adicionar()
Add () na série Pyspark Pandas é usado para adicionar elementos em toda a série com um valor.
É preciso o valor como um parâmetro.
Sintaxe
Pyspark_series.adicionar valor)Onde,
Exemplo
Neste exemplo, adicionaremos 5 à série.
Saída
Podemos ver que 10 é adicionado a cada elemento da série.
Pyspark.Pandas.Series.sub()
sub () na série Pyspark Pandas é usado para subtrair elementos em toda a série com um valor.
É preciso o valor como um parâmetro.
Sintaxe
Pyspark_series.sub (valor)Onde,
Exemplo
Neste exemplo, subtrairemos 10 da série.
Saída
Podemos ver que 10 é subtraído de cada elemento da série.
Pyspark.Pandas.Series.mul ()
Mul () na série Pyspark Pandas é usado para multiplicar elementos em toda a série com um valor.
É preciso o valor como um parâmetro.
Sintaxe
Pyspark_series.mul (valor)Onde,
Exemplo
Neste exemplo, multiplicaremos 10 com a série.
Saída
Podemos ver que 10 é multiplicado por cada elemento da série.
Pyspark.Pandas.Series.div ()
div () na série Pyspark Pandas é usado para dividir os elementos de toda a série por um valor. Ele retorna um quociente.
É preciso o valor como um parâmetro.
Sintaxe
Pyspark_series.div (valor)Onde,
Exemplo
Neste exemplo, dividiremos a série por 10.
Saída
Podemos ver cada elemento da série é dividido por 10 e devolvido quociente.
Pyspark.Pandas.Series.mod ()
div () na série Pyspark Pandas é usado para dividir os elementos de toda a série por um valor. Ele retorna o restante.
É preciso o valor como um parâmetro.
Sintaxe
Pyspark_series.mod (valor)Onde,
Exemplo
Neste exemplo, dividiremos a série por 10.
Saída
Podemos ver cada elemento da série é dividido por 10 e devolvido o restante.
Conclusão
Neste tutorial Pyspark Pandas, discutimos operações aritméticas realizadas na série Pyspark Pandas. Add () é usado para adicionar todos os valores em toda a série e sub () é usado para subtrair valores de toda a série Pyspark Pandas. Mul () é usado para multiplicar todos os valores em toda a série com um valor, e div () é usado para dividir todos os valores por um valor na série Pyspark Pandas e retornar o quociente. mod () é usado para dividir todos os valores por um valor na série Pyspark Pandas e retornar o restante. A diferença entre mod () e div () é mod () retorna restante, mas div () retorna quociente.