Eles podem ser usados com a cláusula de filtro ou onde a cláusula. Vamos vê -los um por um com exemplos diferentes.
como () função
A função Like () em Pyspark é usada para verificar se existe uma string ou um padrão em uma coluna de DataFrame de Pyspark. Se existir, as linhas correspondentes serão devolvidas. Caso contrário, um quadro de dados vazio é retornado. É sensível ao caso.
Sintaxe
dataframe_object.filtro (dataframe_obj.coluna.como (padrão/string))Onde,
dataframe_object é o pyspark dataframe.
Parâmetro:
O como() A função tem um parâmetro.
Pode ser um padrão ou uma sequência de tal.
Retornar:
Com base neste valor da coluna, toda a linha é retornada.
Primeiro, criaremos o Pyspark DataFrame com 10 linhas e 5 colunas.
Importar PysparkSaída:
Agora, vamos aplicar a função como () no quadro de dados Pyspark para retornar os resultados.
Exemplo 1
Forneceremos a string, 'sravan', na coluna de nome dentro do método como () e retornar todas as linhas que correspondem a essa string.
Saída:
Você pode ver que Sravan é encontrado três vezes e as linhas foram devolvidas.
Exemplo 2
Forneceremos a string, 'php', na coluna Technology1 dentro do método como () e retornar todas as linhas que correspondem a essa string.
Saída:
Você pode ver que o PHP não é encontrado na coluna Technology1. Portanto, 0 linhas foram devolvidas.
função ilike ()
A função ilike () em Pyspark é usada para verificar se uma string ou um padrão existe em uma coluna de quadro de dados Pyspark. Se existir, as linhas correspondentes serão devolvidas. Caso contrário, o quadro de dados vazio é retornado. É insensível ao caso.
Sintaxe
dataframe_object.filtro (dataframe_obj.coluna.ilike (padrão/string))Onde,
dataframe_object é o pyspark dataframe.
Parâmetro:
A função ilike () tem um parâmetro.
Pode ser um padrão ou uma string de tal forma que a função ilike () verificará se o valor especificado está presente na coluna DataFrame ou não.
Retornar:
Com base neste valor da coluna, toda a linha é retornada.
Exemplo 1
Forneceremos a string, 'sravan', na coluna de nome dentro do método ilike () e retornar todas as linhas que correspondem a essa string.
Saída:
Explicação
Você pode ver que Sravan é encontrado três vezes e as linhas foram devolvidas.
Exemplo 2
Forneceremos a string, 'php', na coluna Technology1 dentro do método como () e retornar todas as linhas que correspondem a essa string.
Saída:
Explicação
Você pode ver que o PHP não é encontrado na coluna Technology1. Mas ilike () é insensível ao caso. Então, é preciso PHP e PHP como o mesmo. Então, as linhas foram devolvidas.
Conclusão
Neste tutorial Pyspark, vimos duas funções que retornam valores com base na correspondência da string na coluna Pyspark Dataframe. As funções como () e ilike () são usadas para verificar se uma string ou um padrão existe em uma coluna de pyspark dataframe. A diferença é como () é sensível ao caso e o ilike () é insensível ao caso.