Os pandas alteram o tipo de coluna para string

Os pandas alteram o tipo de coluna para string
Os tipos de colunas de um quadro de dados podem precisar ser alterados após a criação por vários motivos, como converter uma coluna em um formato numérico que possa ser usado para modelar e classificar. Este tutorial mostra como converter os valores da coluna em um tipo de dados de string usando o pacote de pandas do Python. Vamos tentar ensiná -lo a mudar os valores flutuantes e inteiros de pandas em strings. Além disso, você aprenderá os benefícios de usar o tipo de dados da string em pandas, bem como como as strings evoluíram em pandas. Usaremos funções diferentes para alterar o Dataypes da coluna DataFrame para uma string.

String Datatype em pandas

Os pandas usam o tipo de dados do objeto por padrão para armazenar strings. Strings e tipos de dados mistos são tratados pelo tipo de dados do objeto, no entanto, não é explícito particularmente. Houve um tipo de dados dedicado de string em pandas na versão 1.0. Embora esse tipo de dados ainda não forneça nenhum recurso explícito ou melhorias de desempenho, a equipe de desenvolvimento de pandas disse que isso acontecerá no futuro. Como resultado, este tutorial empregará exclusivamente o String Datatype. Use o "str" ​​no lugar da corda sempre que possível se você estiver usando uma versão python menos de 1.0.

Como alterar a coluna Pandas para string

Diferentes funções podem ser usadas para alterar a coluna em pandas para string datatype. Usar o método astype () é a maneira mais comum de fazê -lo. Vamos dar uma olhada na função astype () para ver como funciona.

Sintaxe: df.ASTYPE ("column_name": str, erros = "raise")

df.astype (): Um método para chamar a função Pandas Astype.

"Nome da coluna": STR: Colunas a serem convertidas em um formato diferente (string datatype). O nome da coluna é a coluna cujo tipo de dados será alterado. Os valores da coluna precisam ser transformados no tipo de dados necessário, que é string. Qualquer tipo de dados interno de python ou tipo de dados é aceitável.

erros = 'Raise': Para definir como as exceções devem ser tratadas durante a conversão. Somente os valores possíveis das células são convertidos; "Raise" exibirá um erro e "ignorar" irá ignorá -lo.

Vimos a sintaxe do método astype (). Agora, nos exemplos a seguir, você aprenderá a usar o ASTYPE (), outras funções e atributos para converter as colunas de dados de dados em strings.

Exemplo 1: Usando o método astype ()

Um objeto Pandas pode ser convertido em um tipo de dados específico usando o método astype (). Qualquer coluna existente apropriada pode ser convertida em um tipo categórico usando a função ASTYPE (). Quando precisamos converter o tipo de dados de uma coluna específica em outro tipo de dados, o método astype () é muito útil. Neste exemplo, alteraremos o tipo de dados da coluna para string usando a função ASTYPE () para criar um DataFrame. Para criar um DataFrame, primeiro importaremos a biblioteca de pandas para usar seus recursos e funcionalidades.


Criamos nosso quadro de dados passando um dicionário para o PD.DataFrame () função como um argumento. As chaves do dicionário se tornam os rótulos para cada coluna depois de passá -las no PD.Função DataFrame () e os valores das chaves se tornam os valores das colunas do quadro de dados. Para visualizar o DataFrame, usamos a função print ().


No quadro de dados anteriores, temos quatro colunas de dados de dados. A primeira coluna "Student" contém os nomes dos alunos - "Jack", "Tony", "Marty", "Alex", "Rob". Na segunda coluna “Age”, as idades de cada aluno são armazenadas “16, 15, 18, 17, 17”. Enquanto a coluna "Fee" armazena a taxa de cada curso "7000.0, 6500.0, 7100.0, 7000.0, 6900.0 ”. O assunto da coluna consiste nos nomes dos assuntos - "inglês", "estatística", "matemática", "inglês", "ciência" . Podemos verificar o tipo de dados de cada linha usando o atributo dTypes da seguinte maneira:


O tipo de dados das colunas “aluno” e “assunto” é “objeto”.Enquanto o tipo de dados das colunas “idade” e “taxa” é INT64 e Float64, respectivamente. Agora, vamos alterar o tipo de dados da coluna "Taxa" de flutuação para string.


Como aplicamos o método ASTYPES () e passamos o tipo de dados "string" para alterar o tipo de dados da coluna "Taw", vamos ver se a coluna é convertida em uma string ou não.


Você pode notar que o tipo de dados da coluna “Taxa” é convertido em string de float64.

Exemplo 2: Usando o MAP () e Método Aplicar ()

O método map () é usado para converter os valores da série em suas entradas correspondentes. Para alterar cada valor de dados em uma série com um valor diferente, a função map () é usada. Esse valor pode ser obtido de uma série, um ditado ou uma função enquanto os usuários podem passar uma função e aplicá -lo a todos. No entanto, essas funções podem ser usadas para alterar o tipo de dados de colunas. Vamos usar o mesmo quadro de dados que criamos no exemplo anterior.


Agora, verificamos os tipos de dados das colunas usando o atributo dtypes.


Agora, vamos alterar os tipos de dados da coluna "Age" usando a função map () e alterar os tipos de dados da coluna "Taxa" com a função Apply ().


Aplicamos o mapa () e a função Apply () na coluna "Taxa" e "Age", respectivamente. Vamos usar o atributo dtypes em nosso quadro de dados "df" para ver os resultados.


Aqui, podemos ver que o tipo de dados "String" não pode ser usado ao usar o MAPA () e APLICAR () Método. Ambas as colunas “idade” e “taxa” agora são convertidas para o objeto Datatype como resultado. No entanto, os pandas usam o tipo de dados do objeto por padrão para armazenar as "strings", mas queremos o resultado no tipo de dados "string". Por esse motivo, não aconselharíamos usar esses métodos nas novas versões do Python para alterar os tipos de dados das colunas.

Exemplo 3: Usando o método astype ()

Por último, mas não menos importante, usamos o método astype () para alterar o tipo de dados do DataFrame em strings. Vimos como alterar os tipos de dados de colunas específicas do quadro de dados em "String" nos exemplos anteriores. Agora, mudamos os tipos de dados de todas as colunas para "string" neste exemplo. Novamente, utilizamos o quadro de dados "df" para este exemplo.


Ao usar o atributo dtypes, vamos primeiro verificar os tipos de dados de nossas colunas de dados de dados "DF".


Nenhuma das colunas do quadro de dados anterior tem uma coluna com string datatype. Agora, usamos o método astype () para alterar o tipo de dados de todas as colunas do quadro de dados no tipo de dados "string".


Como pode ser visto, simplesmente usando a propriedade ASTYPE () com o DataFrame ao passar a "string" dentro da função, você pode alterar facilmente todas as colunas do quadro de dados para string.


Os tipos de dados de cada coluna são alterados para string.

Também podemos usar a função ApplyMap () ou a .valores.astype () para converter os tipos de dados, mas eles retornarão o tipo de dados do "objeto" em vez de "string".

Conclusão

Neste tutorial, discutimos o que é uma string de dados de dados em Python e como você pode alterar a coluna Pandas na string. Aprendemos a sintaxe da função astype () para entender como funciona. Depois de passar por este tutorial, você poderá mudar as colunas na string sozinho. Implementamos exemplos diferentes para ensinar como o método astype the map () e aplicação () pode ser usado para alterar as colunas do pandas para string de dados de dados.