Pandas to_records

Pandas to_records
O DataFrame de dados de pandas é um formato de dados tabulares de tamanho bidimensional por tamanho bidimensional com eixos nomeados. Para operações matemáticas, os rótulos de linha e coluna devem sempre estar alinhados. A estrutura de dados fundamentais dos pandas é comparável a um ditado, pois atua como um contêiner para itens da série.

DataFrame é convertido em uma matriz de registros Numpy usando o DataFrame de dados pandas.para registros () função. O índice geralmente é dado como o campo inicial do registro. Discutiremos o método pandas to_records () com exemplos neste artigo.

O que é um quadro de dados?

Pandas é um pacote popular de ciência de dados Python por um motivo: fornece estruturas de dados poderosas, expressivas e flexíveis que facilitam a manipulação e análise de dados, entre outras coisas. O DataFrame é uma dessas estruturas.

Um quadro de dados é uma estrutura de dados bidimensional na qual os dados são representados na forma de linhas e colunas. Um quadro de dados de pandas é composto de três componentes primários: dados, linhas e colunas.

Como eles fornecem uma maneira flexível e fácil de armazenar e trabalhar com dados, os quadros de dados são uma das estruturas de dados mais usadas na análise de dados modernos.

Para criar um quadro de dados de pandas, listas, séries, ditos, numpy ndarrays e outro dataframe podem ser usados ​​para criar um quadro de dados de pandas.

Qual é a sintaxe dos pandas.Quadro de dados.funções para_records ()?

O método to_records () é para converter um DataFrame em uma matriz de registros Numpy relevante. A função to_records () em pandas tem a seguinte sintaxe.

# Quadro de dados.to_records (index = true, column_dtypes = nenhum, index_dtypes = nenhum)

Todos os detalhes sobre os parâmetros estão na seção a seguir.

Índice

Inclua o índice na matriz de registros resultantes, que pode ser armazenada no campo 'índice' ou acessado através do rótulo do índice, se for definido.

Column_dtypes

Se o tipo de dados for uma string ou um tipo, ele será usado para armazenar todas as colunas.

Index_dtypes

Se o tipo de dados for uma string ou talvez um tipo, ela será usada para manter todos os níveis de índice. Se for um dicionário, o mapeamento de nomes de nomes do índice, bem como os índices, são usados ​​para especificar tipos de dados. Somente se index = true é esse mapeamento usado.

Vamos discutir o tópico em profundidade com diferentes exemplos. Você pode implementar esses exemplos e ver o conceito geral de uma maneira melhor.

Exemplo 1:

O DataFrame.To_records () Função do Python é alterar o quadro de dados especificado em uma matriz de registro Numpy. Considere o código dado abaixo como um exemplo.

Construímos um quadro de dados com valores para três qualidades diferentes: 'salário, nome do funcionário e idade'; 39000, 44000, 25000 e 55000 são os valores para o salário da propriedade.'Alex, Andrew, Zack e Kim estão entre os valores para o atributo' Nome do funcionário.'

Da mesma forma, o atributo de idade compreende os valores 39, 44, 25 e 55. O índice foi construído e definido. O DataFrame é então impresso.

Importar pandas
d_frame = pandas.DataFrame ('Salário': [39000, 44000, 25000, 55000],
'Nome do funcionário': ['Alex', 'Andrew', 'Zack', 'Kim'],
'Idade': [39, 44, 25, 55])
index_ = pandas.date_range ('2020-08-05 07:30', períodos = 4, Freq = 'H')
d_frame.índice = index_
Imprimir (d_frame)

O salário, o nome do funcionário e os valores da idade, bem como a data e a hora, são mostrados na captura de tela abaixo.

Na captura de tela a seguir, o quadro de dados especificado para uma representação relevante da matriz de registros Numpy é mostrada.

Importar pandas
d_frame = pandas.DataFrame ('Salário': [39000, 44000, 25000, 55000],
'Nome do funcionário': ['Alex', 'Andrew', 'Zack', 'Kim'],
'Idade': [39, 44, 25, 55])
index_ = pandas.date_range ('2020-08-05 07:30', períodos = 4, Freq = 'H')
d_frame.índice = index_
Imprimir (d_frame)
resultado = d_frame.to_records ()
Imprimir (resultado)

A próxima imagem anexada explica que o DataFrame.A função to_records () é utilizada para alterar o quadro de dados para uma representação relevante de matriz de registros Numpy.

Exemplo 2:

Veremos como usar o DataFrame.To_records () função no segundo exemplo. O código é semelhante ao mencionado acima. Importamos o módulo Pandas primeiro desta vez e depois geramos o DataFrame.

O índice foi então formado como mostrado no código: index_ = ['primeira linha', 'segunda linha', 'terceira linha', 'quarta linha' e 'quinta linha']. Finalmente, definimos o índice e imprimimos os resultados do quadro de dados. Veja a última linha do código.

Importar pandas
dta_frame = pandas.Dataframe ("1": [9, 3, 4, nenhum, 6],
"2": [8, 1, 22, 35, nenhum],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, nenhum, 1, 9])
index_ = ['First_row', 'Second_row', 'terceiro_row', 'Fourth_row', 'quinta_row']
dta_frame.índice = index_
Imprimir (dta_frame)

Você pode ver o resultado aqui, que inclui o índice e o DataFrame.

Usando o DataFrame.Para a função Records (), convertemos o DataFrame fornecido. Você pode visualizá -lo na seguinte captura de tela em anexo.

Importar pandas
dta_frame = pandas.Dataframe ("1": [9, 3, 4, nenhum, 6],
"2": [8, 1, 22, 35, nenhum],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, nenhum, 1, 9])
index_ = ['First_row', 'Second_row', 'terceiro_row', 'Fourth_row', 'quinta_row']
dta_frame.índice = index_
Imprimir (dta_frame)
Resultado = dta_frame.to_records ()
Imprimir (resultado)

Depois de fazer alterações mínimas no código de referência acima, este é o resultado. O DataFrame.A função to_records () altera um quadro de dados específico para uma representação relevante da matriz de registros Numpy.

Exemplo 3:

Em nosso exemplo final, veremos como converter um quadro de dados de pandas usando a técnica Numpy-os pandas. O método to_numpy pode ser usado para transformar essa estrutura de dados em uma matriz numpy.

Você pode ver no código que importamos os módulos Pandas e Numpy, que são essenciais para o código executar. Construímos o DataFrame depois de importar os módulos. Existem 5 linhas e 3 colunas de dados no quadro de dados.

Depois disso, o DataFrame é transformado em uma matriz Numpy. O quadro de dados transformado e seu tipo são exibidos.

Importar pandas
importar numpy
data_frame = pandas.Quadro de dados(
dados = numpy.aleatório.Randint (
0, 10, (5,3)),
colunas = ["a", "b", "c"])
CLS_RES = DATA_FRAME.to_numpy ()
Imprimir (cls_res)
Imprimir (tipo (cls_res))

A saída está na próxima captura de tela. Os valores de dados dentro das 5 linhas e 3 colunas do quadro construído podem ser vistos aqui. A classe também é exibida na última linha da saída. Como ilustrado acima, o método Pandas DataFrame para Numpy () transforma um DataFrame em uma matriz Numpy.

Conclusão:

A função to_record () no Python é descrita neste artigo. O quadro de dados de pandas também é bem ensinado com exemplos. As etapas para converter um DataFrame utilizando o método DataFrame para_records () também são explicadas.