No Python, Pyspark é um módulo Spark usado para fornecer um tipo semelhante de processamento como o Spark usando o DataFrame. Ele fornece o método show (), que exibe o quadro de dados em um formato tabular.
Sintaxe:
Quadro de dados.show (n, vertical, truncado)
Onde dataframe é o pyspark dataframe de entrada
Parâmetros:
1. n é o primeiro parâmetro opcional que representa o valor inteiro para obter as linhas superiores no quadro de dados e n representa o número de linhas superiores a serem exibidas. Por padrão, ele exibirá todas as linhas do DataFrame
2. O parâmetro vertical leva os valores booleanos, que são usados para exibir o quadro de dados no parâmetro vertical quando está definido como true. e exibir o quadro de dados em formato horizontal quando está definido como false. Por padrão, ele será exibido em formato horizontal
3. truncado é usado para obter o número de caracteres de cada valor no quadro de dados. Será preciso um número inteiro como alguns personagens a serem exibidos. Por padrão, ele exibirá todos os personagens.
Exemplo 1:
Neste exemplo, criaremos um pyspark DataFrame com 5 linhas e 6 colunas e exibiremos o quadro de dados usando o método show () sem parâmetros.
Portanto, isso resulta em um quadro de dados tabulares exibindo todos os valores no quadro de dados
#import o módulo PysPaprk
Importar Pyspark
#Import SparkSession para criar uma sessão
de Pyspark.SQL Import SparkSession
#Crie um aplicativo chamado Linuxhint
Spark_App = SparkSession.construtor.AppName ('Linuxhint').getorcreate ()
# Crie dados dos alunos com 5 linhas e 6 atributos
alunos = ['rollno': '001', 'nome': 'sravan', 'idade': 23, 'altura': 5.79, 'Peso': 67, 'Endereço': 'Guntur',
'rollno': '002', 'nome': 'ojaswi', 'idade': 16, 'altura': 3.79, 'Peso': 34, 'Endereço': 'Hyd',
'rollno': '003', 'nome': 'gnanesh chowdary', 'idade': 7, 'altura': 2.79, 'Peso': 17, 'Endereço': 'Patna',
'rollno': '004', 'nome': 'rohith', 'idade': 9, 'altura': 3.69, 'Peso': 28, 'Endereço': 'Hyd',
'rollno': '005', 'nome': 'sridevi', 'idade': 37, 'altura': 5.59, 'Peso': 54, 'Endereço': 'Hyd']
# Crie o DataFrame
df = spark_app.CreatedAtAframe (estudantes)
# quadro de dados
df.mostrar()
Saída:
Exemplo 2:
Neste exemplo, criaremos um pyspark DataFrame com 5 linhas e 6 colunas e exibiremos o quadro de dados usando o método show () com o parâmetro N. Definimos o valor n para 4 para exibir as 4 principais linhas do DataFrame.
Portanto, isso resulta em um quadro de dados tabulares exibindo 4 valores no DataFrame.
#import o módulo PysPaprk
Importar Pyspark
#Import SparkSession para criar uma sessão
de Pyspark.SQL Import SparkSession
#Crie um aplicativo chamado Linuxhint
Spark_App = SparkSession.construtor.AppName ('Linuxhint').getorcreate ()
# Crie dados dos alunos com 5 linhas e 6 atributos
alunos = ['rollno': '001', 'nome': 'sravan', 'idade': 23, 'altura': 5.79, 'Peso': 67, 'Endereço': 'Guntur',
'rollno': '002', 'nome': 'ojaswi', 'idade': 16, 'altura': 3.79, 'Peso': 34, 'Endereço': 'Hyd',
'rollno': '003', 'nome': 'gnanesh chowdary', 'idade': 7, 'altura': 2.79, 'Peso': 17, 'Endereço': 'Patna',
'rollno': '004', 'nome': 'rohith', 'idade': 9, 'altura': 3.69, 'Peso': 28, 'Endereço': 'Hyd',
'rollno': '005', 'nome': 'sridevi', 'idade': 37, 'altura': 5.59, 'Peso': 54, 'Endereço': 'Hyd']
# Crie o DataFrame
df = spark_app.CreatedAtAframe (estudantes)
# Obtenha as 4 principais linhas no quadro de dados
df.show (4)
Saída:
Exemplo 3:
Neste exemplo, criaremos um pyspark DataFrame com 5 linhas e 6 colunas e exibiremos o quadro de dados usando o método show () com um parâmetro vertical. Definimos vertical como false para exibir o quadro de dados na visualização horizontal.
Portanto, isso resulta em um quadro de dados tabulares exibindo todos os valores na visualização horizontal.
#import o módulo PysPaprk
Importar Pyspark
#Import SparkSession para criar uma sessão
de Pyspark.SQL Import SparkSession
#Crie um aplicativo chamado Linuxhint
Spark_App = SparkSession.construtor.AppName ('Linuxhint').getorcreate ()
# Crie dados dos alunos com 5 linhas e 6 atributos
alunos = ['rollno': '001', 'nome': 'sravan', 'idade': 23, 'altura': 5.79, 'Peso': 67, 'Endereço': 'Guntur',
'rollno': '002', 'nome': 'ojaswi', 'idade': 16, 'altura': 3.79, 'Peso': 34, 'Endereço': 'Hyd',
'rollno': '003', 'nome': 'gnanesh chowdary', 'idade': 7, 'altura': 2.79, 'Peso': 17, 'Endereço': 'Patna',
'rollno': '004', 'nome': 'rohith', 'idade': 9, 'altura': 3.69, 'Peso': 28, 'Endereço': 'Hyd',
'rollno': '005', 'nome': 'sridevi', 'idade': 37, 'altura': 5.59, 'Peso': 54, 'Endereço': 'Hyd']
# Crie o DataFrame
df = spark_app.CreatedAtAframe (estudantes)
# Obtenha o quadro de dados de maneira horizontal
df.show (vertical = false)
Saída:
Exemplo 4:
Neste exemplo, criaremos um pyspark DataFrame com 5 linhas e 6 colunas e exibiremos o quadro de dados usando o método show () com um parâmetro vertical. Definimos vertical como true para exibir o quadro de dados na visualização vertical.
Portanto, isso resulta em um quadro de dados tabulares exibindo todos os valores na visualização vertical.
#import o módulo PysPaprk
Importar Pyspark
#Import SparkSession para criar uma sessão
de Pyspark.SQL Import SparkSession
#Crie um aplicativo chamado Linuxhint
Spark_App = SparkSession.construtor.AppName ('Linuxhint').getorcreate ()
# Crie dados dos alunos com 5 linhas e 6 atributos
alunos = ['rollno': '001', 'nome': 'sravan', 'idade': 23, 'altura': 5.79, 'Peso': 67, 'Endereço': 'Guntur',
'rollno': '002', 'nome': 'ojaswi', 'idade': 16, 'altura': 3.79, 'Peso': 34, 'Endereço': 'Hyd',
'rollno': '003', 'nome': 'gnanesh chowdary', 'idade': 7, 'altura': 2.79, 'Peso': 17, 'Endereço': 'Patna',
'rollno': '004', 'nome': 'rohith', 'idade': 9, 'altura': 3.69, 'Peso': 28, 'Endereço': 'Hyd',
'rollno': '005', 'nome': 'sridevi', 'idade': 37, 'altura': 5.59, 'Peso': 54, 'Endereço': 'Hyd']
# Crie o DataFrame
df = spark_app.CreatedAtAframe (estudantes)
# Obtenha o quadro de dados de uma maneira vertical
df.show (vertical = true)
Saída:
Exemplo 5:
Neste exemplo, criaremos um pyspark dataframe com 5 linhas e 6 colunas e exibiremos o quadro de dados usando o método show () com parâmetro truncado. Definimos o valor truncado como 1 para exibir o primeiro caractere em todas as fileiras do quadro de dados.
Portanto, isso resulta em um quadro de dados tabulares exibindo o primeiro caractere na visualização horizontal.
#import o módulo PysPaprk
Importar Pyspark
#Import SparkSession para criar uma sessão
de Pyspark.SQL Import SparkSession
#Crie um aplicativo chamado Linuxhint
Spark_App = SparkSession.construtor.AppName ('Linuxhint').getorcreate ()
# Crie dados dos alunos com 5 linhas e 6 atributos
alunos = ['rollno': '001', 'nome': 'sravan', 'idade': 23, 'altura': 5.79, 'Peso': 67, 'Endereço': 'Guntur',
'rollno': '002', 'nome': 'ojaswi', 'idade': 16, 'altura': 3.79, 'Peso': 34, 'Endereço': 'Hyd',
'rollno': '003', 'nome': 'gnanesh chowdary', 'idade': 7, 'altura': 2.79, 'Peso': 17, 'Endereço': 'Patna',
'rollno': '004', 'nome': 'rohith', 'idade': 9, 'altura': 3.69, 'Peso': 28, 'Endereço': 'Hyd',
'rollno': '005', 'nome': 'sridevi', 'idade': 37, 'altura': 5.59, 'Peso': 54, 'Endereço': 'Hyd']
# Crie o DataFrame
df = spark_app.CreatedAtAframe (estudantes)
# Obtenha o DataFrame, obtendo apenas o primeiro caractere em todas as fileiras
df.show (truncado = 1)
Saída:
Conclusão
Este artigo discutiu o método show () em Pyspark e sua funcionalidade. Consideramos todos os parâmetros com valores para o DataFrame exibir o quadro de dados em formato tabular.