Pandas para matar

Pandas para matar
O método mais comum e popular para converter o quadro de dados em uma matriz é usar a função to_numpy (). Em Numpy, as dimensões são chamadas de eixo. A “matriz.Classe ”da Biblioteca Python padrão é distinta do Numpy.variedade. Também temos o atributo "valores" e os métodos para_records ().

Método 1: Usando to_numpy ()

Quando aplicamos o método to_numpy () no Pandas Dataframe, um objeto do tipo de dados Numpy, o NDARRAY é retornado como saída. Normalmente, um ndarray bidimensional é devolvido. Vamos dar uma olhada na sintaxe da função antes de ver o funcionamento da função nos exemplos a seguir.

Sintaxe:

Dataframe_object.to_numpy (dtype = nenhum, copy = false, na_value = nodefault.nenhum padrão)

Parâmetros:

  1. dtype: Numpy.dtype, str ou opcional. O tipo de dados é passado para Numpy.asarray ().
  2. cópia de: Bool, falso por padrão. Se deve verificar se a saída/dados/valor retornados não é uma visualização nas outras matrizes. O to_numpy () não é garantido para não ser cópia quando cópia = false é usado. Em vez disso, copy = true faz uma cópia, mesmo que não seja estritamente necessária.
  3. Na_Value: Qualquer opção. O valor a ser substituído se houver valores ausentes. O valor, por padrão, depende dos dtypes das colunas no quadro de dados.

Exemplo 1:
Vamos ter um quadro de dados com 5 linhas e 3 colunas e convertê -lo em uma matriz Numpy usando o método to_numpy ().

Importar pandas
importar numpy
# Considere o quadro de dados de pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "tear da mão", 1000],
[4, "Loom da mão", 2000],
[5, "vestir", 3000]],
colunas = ['id', 'trabalho', 'salários'],
índice = ['Pessoa 1', 'Pessoa 2', 'Pessoa 3', 'Pessoa 4', 'Pessoa 5'])
# Exiba o quadro de dados convertido
Imprimir (real, "\ n")
# Converter para a matriz numpy
convertido = real.to_numpy ()
# Exiba o tipo de matriz numpy
Imprimir (tipo (convertido), "\ n")
Imprimir (convertido)

Saída:

Explicação:
Depois de converter para a matriz Numpy, usamos a função Tipo () para exibir o tipo de matriz convertida. Você pode ver que 5 linhas são armazenadas em uma matriz numpy.

Exemplo 2:
Converta apenas duas colunas no DataFrame em Numpy Array usando o método to_numpy (). Aqui, temos que especificar os nomes das colunas para serem convertidos para a matriz Numpy em uma lista.

Importar pandas
importar numpy
# Considere o quadro de dados de pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "tear da mão", 1000],
[4, "Loom da mão", 2000],
[5, "vestir", 3000]],
colunas = ['id', 'trabalho', 'salários'],
índice = ['Pessoa 1', 'Pessoa 2', 'Pessoa 3', 'Pessoa 4', 'Pessoa 5'])
# Converter apenas 'trabalho' e 'salários' colunas para matriz numpy
Imprimir ([['trabalho', 'salários']]]].to_numpy ())

Saída:

Explicação:
Podemos ver que apenas duas colunas ["trabalho", "salários"] são convertidas para a matriz Numpy.

Método 2: Usando o atributo de valores

Os "valores" são um atributo que converte o quadro de dados de pandas para a matriz Numpy diretamente.

Sintaxe:

Dataframe_object.valores

Exemplo 1: converta todo o quadro de dados em matriz numpy
Considere o DataFrame anterior e converta -o em uma matriz Numpy usando o método to_numpy ().

Importar pandas
importar numpy
# Considere o quadro de dados de pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "tear da mão", 1000],
[4, "Loom da mão", 2000],
[5, "vestir", 3000]],
colunas = ['id', 'trabalho', 'salários'],
índice = ['Pessoa 1', 'Pessoa 2', 'Pessoa 3', 'Pessoa 4', 'Pessoa 5'])
# Use o atributo dos valores para converter o quadro de dados acima para a matriz numpy.
Imprimir (real.valores)
Imprimir (tipo (real.valores))

Saída:

Explicação:
Você pode ver todas as colunas no quadro de dados para a matriz Numpy.

Exemplo 2: converta algumas colunas em matriz numpy
Converta apenas duas colunas no DataFrame em Numpy Array usando o método to_numpy (). Aqui, temos que especificar os nomes das colunas para serem convertidos para a matriz Numpy em uma lista.

Importar pandas
importar numpy
# Considere o quadro de dados de pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "tear da mão", 1000],
[4, "Loom da mão", 2000],
[5, "vestir", 3000]],
colunas = ['id', 'trabalho', 'salários'],
índice = ['Pessoa 1', 'Pessoa 2', 'Pessoa 3', 'Pessoa 4', 'Pessoa 5'])
Imprimir ([['trabalho', 'salários']]]].valores)

Saída:

Podemos ver que apenas duas colunas ["trabalho", "salários"] são convertidas para a matriz Numpy.

Método 3: Usando o to_records ()

O "to_records ()" converte diretamente o quadro de dados existente em uma matriz Numpy que é do tipo de matriz de registros. A vantagem de usar esse método é que, para cada linha convertida, o índice também vem na matriz de registros.

Sintaxe:

Dataframe_object.to_records ()

Exemplo 1: converta todo o quadro de dados em matriz numpy
Considere o DataFrame anterior e converta -o em uma matriz Numpy usando o método to_records ().

Importar pandas
importar numpy
# Considere o quadro de dados de pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "tear da mão", 1000],
[4, "Loom da mão", 2000],
[5, "vestir", 3000]],
colunas = ['id', 'trabalho', 'salários'],
índice = ['Pessoa 1', 'Pessoa 2', 'Pessoa 3', 'Pessoa 4', 'Pessoa 5'])
# Use to_records () para converter o quadro de dados acima para a matriz numpy.
Imprimir (real.to_records (), "\ n")
# Obtenha o tipo de dados
Imprimir (tipo (real.to_records ()))

Saída:

Explicação:
Você pode ver todas as colunas no quadro de dados para a matriz Numpy e a matriz retornada é uma matriz de registro. Em cada registro, você também pode ver o índice.

Exemplo 2: converta algumas colunas em matriz numpy
Use o método to_records () para converter as 2 primeiras colunas no DataFrame em uma matriz Numpy.

Importar pandas
importar numpy
# Considere o quadro de dados de pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "tear da mão", 1000],
[4, "Loom da mão", 2000],
[5, "vestir", 3000]],
colunas = ['id', 'trabalho', 'salários'],
índice = ['Pessoa 1', 'Pessoa 2', 'Pessoa 3', 'Pessoa 4', 'Pessoa 5'])
# Use to_records () para converter as 2 primeiras colunas no quadro de dados em uma matriz Numpy.
Imprimir ([['id', 'trabalho']]]].to_records (), "\ n")

Saída:

As duas primeiras colunas são convertidas para a matriz Numpy.

Conclusão

Discutimos o que são matrizes e como os quadros de dados em pandas podem ser convertidos em colunas Numpy. Utilizamos três métodos para mudar as colunas de quadro de dados em uma matriz. Nos exemplos deste artigo, tentamos ensiná -lo a converter as colunas específicas ou todo o quadro de dados em uma matriz Numpy usando a função to_numpy (). Também usamos o atributo de valores e o método para_records () para converter as colunas de dados em uma matriz Numpy.