Os pandas convertem todas as colunas para string

Os pandas convertem todas as colunas para string
Pandas, um pacote de software Python, oferece processamento e avaliação de dados. Ele aborda os dados ausentes com facilidade e é rápido, adaptável e claro. A estrutura de dados robusta não apenas oferece, mas também melhora a funcionalidade das ferramentas para modificação e análise de dados.

Um tipo de dados é um bloco de construção fundamental usado pelas linguagens do computador para entender como preservar e alterar os dados. Em um quadro de dados de pandas, você pode frequentemente transformar as colunas únicas ou múltiplas em strings. Convenientemente, usando as várias funções nativas dos pandas, isso é simples de realizar.

Este artigo ensinará como transformar os valores em uma coluna em um tipo de dados de string usando a biblioteca de pandas em Python. Você descobrirá como transformar os carros alegóricos e inteiros em strings de pandas. Você descobrirá como converter as colunas em um quadro de dados de pandas em uma string, além das quatro maneiras distintas de fazê -lo. O DataFrame.ASTYPE (STR), DataFrame.valores.ASTYPE (STR), DataFrame.Aplicar (STR), DataFrame.mapa (str) e dataframe.Aplicar -se (STR) são alguns dos métodos usados ​​na demonstração para converter qualquer tipo em um tipo de string.

Construindo DataFrame usando pandas.Método DataFrame ()

O primeiro e principal requisito para o programa é importar a biblioteca de pandas como PD para aproveitar os recursos de pandas. O próximo passo é criar um pandas de dados. Vamos construir um DataFrame com três colunas distintas, uma delas corre como uma corda e os outros dois carregarão como números inteiros. Em seguida, empregamos a função print () para exibir seus cinco registros.

Na ilustração anterior, criamos um quadro de dados que utiliza os pandas.Método DataFrame (). Este DataFrame tem três colunas: "Nome", "Idade" e "Salário". Cada coluna armazena cinco registros ou valores. Criamos um objeto DataFrame "Data" e atribuímos -o a saída de chamar o PD.Método DataFrame (). Portanto, o quadro de dados de pandas está acessível usando este objeto. Em seguida, utilizamos a função print () para exibir o DataFrame.

O DataFrame que acabamos de criar aparece no terminal que pode ser visto no instantâneo anexado no seguinte:

Agora, descobrimos os tipos de dados de todas as colunas do DataFrame. Para isso, usamos os pandas .info () função. O .Info () Método nos exibe os detalhes sobre o DataFrame, fornecendo os tipos de dados para cada coluna, permitindo examinar como os pandas processa os dados da string.

Empregamos o quadro de dados de pandas.Info () Método no código anterior. A função print () é então invocada com os dados.info () como seus parâmetros para exibir as informações sobre as colunas do DataFrame do Datatype Datatype.

Esta é a saída exibida no terminal:

No exemplo anterior, podemos observar que os pandas sempre lidam com as cordas como objetos por padrão. Strings e tipos de dados mistos são tratados pelo tipo de dados do objeto. No entanto, não é notavelmente óbvio.

Os pandas têm um tipo de dados específico de string da versão 1.0. Embora esse tipo de dados ainda não forneça aprimoramentos claros de armazenamento ou eficiência, a equipe de desenvolvedores de pandas disse que isso acontecerá no futuro. Como conseqüência, a lição empregará exclusivamente o tipo de dados de string.

Vamos começar convertendo uma coluna em uma string usando a abordagem preferida de pandas.

Exemplo 1:

O primeiro método que utilizamos é a função pandas astype (). A técnica da coluna (série) é uma característica dos pandas.

Se você está operando os pandas 1.0 ou mais tarde, passe na “string”. Caso contrário, use o "str" ​​para as edições dos pandas antes de 1.0. Ao adotar isso, você pode ter certeza de que o tipo de dados da string é usado em vez do tipo de dados do objeto.

Vamos começar com sua demonstração prática em um ambiente Python.

No código anterior usando o DataFrame "Data" criado anteriormente, agora utilizamos os pandas ".função astype () ”. Escrevemos o nome do DataFrame com o “.astype () ”função e forneceu o tipo de dados“ string ”como seu parâmetro. Depois, invocamos o “.Info () ”Método dentro dos parênteses da Função Print () para exibir o tipo de dados atualizado das colunas DataFrame.

A execução do script Python anterior nos produz o seguinte resultado:

A coluna "idade" do nosso quadro de dados de pandas, que foi inicialmente mantida como um INT64, é atualmente tratada como um tipo de dados de string como pode ser visto.

Exemplo 2:

Você pode empregar o .Técnica de mapa () para alterar uma coluna de pandas para seqüências de cordas de uma maneira idêntica ao .Função da série ASTYPE ().

Vamos explorar o que parece ser:

A ilustração começa utilizando o código do quadro de dados que explicamos no exemplo anterior. Depois de imprimir o quadro de dados, exibimos os tipos de dados com o auxílio do “.info () ”função. Agora, escolhemos uma coluna cujo tipo de dados é neded para converter em uma string. Selecionamos a coluna "idade" novamente para o referido propósito. Então, invocamos o “.função map () ”com o objeto DataFrame e o nome da coluna especificada. Também definimos o tipo de dados no ".Map (STR) "Brace da função. Precisamos verificar o tipo de dados atualizado com o “.info () ”método.

A saída pode ser vista na imagem a seguir:

Fica claro a partir disso que o tipo de dados da string não pode ser usado ao utilizar o .Método MAP (). Os dados são armazenados no tipo de dados do objeto como conseqüência. Devido a isso, se você estiver executando uma edição superior a 1.0, recomendamos não empregar este método.

Exemplo 3:

Como a técnica descrita anteriormente, também podemos alterar o tipo de dados de uma coluna de pandas para strings usando o .Método Aplicar (). As mesmas restrições se aplicam, pois somos capazes de transformá -los em tipos de dados de objetos. Ainda não podemos transformá -los em string de dados de dados.

Vamos dar uma olhada:

Como você pode ver no script anterior fornecido, o método Apply () é empregado. Entre os aparelhos desta função, especificamos o tipo de dados. Este método não leva a "string". Em vez disso, funciona com "str". Em seguida, exibimos os tipos de dados com a utilização do método info ().

O terminal resultante mostra que o tipo de dados atualizado foi alterado de int64 para objeto, que é uma string.

Exemplo 4:

Além disso, podemos utilizar o valor dos pandas.ASTYPE () Função para transformar diretamente os valores de uma coluna em strings.

Aqui, exploramos seus trabalhos com a implementação do código Python:

Com o mesmo DataFrame e coluna, utilizamos os pandas “valores.Método astype () ”e passou o tipo de dados“ str ”como seu argumento. Finalmente, exibimos os tipos de dados com o método info ().

Isso nos dá a seguinte saída:

Exemplo 5:

Nosso último segmento ensina como utilizar o .Função Aplicar Map () para transformar todas as colunas de dados de dados do Pandas em strings.

Neste método, usamos o .Método AplicarMap (). Como queremos converter todas as colunas, não precisamos mencionar nenhum nome de coluna específico com o objeto DataFrame, como fizemos anteriormente. Simplesmente usamos o objeto DataFrame com o .Aplicar a função () e passar o tipo de dados "str" ​​como um parâmetro.

Esta é a seguinte saída:

Conclusão

Esta lição é baseada nos diferentes métodos dos pandas para converter as colunas em string de dados de dados. Utilizamos todas as maneiras possíveis de lhe dar várias opções fáceis quando encontrarmos esses problemas. Demonstramos alguns códigos de exemplo práticos para ajudá -lo a aprender as várias técnicas de pandas. Esperamos que este escrito ajude você a entender os módulos de pandas.