Função Pyspark Signum

Função Pyspark Signum
A principal vantagem da função de signo é fornecer um sinal para os valores fornecidos. No Pyspark Dataframe com as colunas numéricas, se o valor for menor que 0, o signum retorna -1. Se o valor for igual a 0, então o sinal retornará 0. Caso contrário, ele retorna 1.

função signum ()

A função Signum () é uma função matemática usada no Pyspark. Está disponível no Pyspark.SQL.Módulo de funções.

Ele pode ser usado com o método Select porque selecionar () exibe os valores do sinal no pyspark DataFrame.

Sintaxe:
dataframe_obj.Selecione (Signum (DataFrame_OBJ.coluna))

Parâmetro:
Ele toma o nome da coluna como um parâmetro para retornar valores de sinal para essa coluna.

Agora, veremos alguns exemplos para entender melhor essa função.

Exemplo 1
Vamos criar um quadro de dados Pyspark com 3 linhas e 4 colunas, além de todos os tipos numéricos e retornar valores.

Importar Pyspark
importação de matemática
de Pyspark.SQL Import SparkSession
de Pyspark.SQL.funções importam signum
Spark_App = SparkSession.construtor.nome do aplicativo('_').getorcreate ()
#Crie valores matemáticos
valores = [(matemática.pi, 0,7.8.120),
(matemática.PI/2,1,0.5.180),
(matemática.pi/3, -5, -12.9.360)
]
#assign colunas criando o pyspark dataframe
dataframe_obj = spark_app.CreatedAtAframe (valores, ['value1', 'value2', 'value3', 'value4'])
dataframe_obj.mostrar()
#Obtenha os valores de signum da coluna Value1
dataframe_obj.Selecione (Signum (DataFrame_OBJ.valor1)).mostrar()

Saída:

Então, para o valor da coluna1, devolvemos os valores do sinal.
3.141592653589793 é maior que 0. Então, o signum é 1.
1.5707963267948966 é maior que 0. Então, o signum é 1.
1.0471975511965976 é maior que 0. Então, o signum é 1.

Exemplo 2
Agora, retornaremos os valores do Signum para as colunas Value2 e Value3.

Importar Pyspark
importação de matemática
de Pyspark.SQL Import SparkSession
de Pyspark.SQL.funções importam signum
Spark_App = SparkSession.construtor.nome do aplicativo('_').getorcreate ()
#Crie valores matemáticos
valores = [(matemática.pi, 0,7.8.120),
(matemática.PI/2,1,0.5.180),
(matemática.pi/3, -5, -12.9.360)
]
#assign colunas criando o pyspark dataframe
dataframe_obj = spark_app.CreatedAtAframe (valores, ['value1', 'value2', 'value3', 'value4'])
dataframe_obj.mostrar()
#Obtenha os valores de signum da coluna Value2 e Value3
dataframe_obj.Selecione (Signum (DataFrame_OBJ.Value2), Signum (DataFrame_OBJ.valor3)).mostrar()

Saída:

Coluna - Value2:

0 é 0. Então, o signum é 0.
1 é maior que 0. Então, o signum é 1.
-5 é menor que 0. Então, o signum é -1.

Coluna - valor3:

7.8 é maior que 0. Então, o signum é 1.
0.5 é maior que 0. Então, o signum é 1.
-12.9 é menor que 0. Então, o signum é -1.

Observação: A função SIGNUM () retornará nulo se você a aplicar nos valores da string. Funciona apenas em dados numéricos.

Conclusão

Neste tutorial Pyspark, discutimos a função Signum (). Signum () é uma função matemática que pode ser usada no Pyspark. Está disponível no Pyspark.SQL.Módulo de funções. Em uma coluna DataFrame, se o valor for menor que 0, o significado retorna -1. Se o valor for igual a 0, o sinal retornará 0. Caso contrário, ele retorna 1.