Pandas converte coluna para int

Pandas converte coluna para int
“O processamento e avaliação de dados são disponibilizados pelo pacote de software Python conhecido como pandas. Um tipo de dados é um bloco de construção subjacente que as linguagens do computador usam para compreender como salvar e modificar dados. Quando um quadro de dados de pandas é criado com dados externos, as colunas numéricas são tipicamente designadas como objetos do tipo de dados em vez de int ou flutuante, o que torna desafiador executar cálculos numéricos neles.

Mostraremos como converter uma coluna Pandas em um INT nesta peça e discutiremos métodos diferentes para alcançar a saída desejada nesta peça de escrita.”

Exemplo 1: Converta a coluna Pandas para int, utilizando a função pandas astype ()

A primeira abordagem que vamos empregar aqui para converter o DataFrame Pandas para Int é usar o método ASTYPE () da Python's Pandas Library. Poderíamos fornecer qualquer tipo de dados Python, Numpy ou Pandas para alterar o tipo de todas as colunas em um quadro de dados, ou poderíamos passar um dicionário com nomes de colunas como chaves e tipo de dados como valores para alterar o tipo de colunas selecionadas.

Aqui, o método astype () nos permite especificar o tipo de dados que exigimos. É bastante adaptável, pois você pode tentar mudar de um tipo para outro.

A sintaxe da função astype (), que permite a conversão do tipo de coluna para int, é a seguinte.

Vamos entender os parâmetros desta função um por um.

O primeiro parâmetro aqui é "dtype", que se refere ao tipo de dados. Todo o objeto Pandas pode ser convertido para o tipo apropriado usando Dtype ou Python Type. Por outro lado, você pode converter um único ou múltiplo das colunas em um quadro de dados em um tipo específico para essa coluna usando a sintaxe “[colmn: dtype,…]” em que a coluna é o nome da coluna, enquanto o dtype é um NP.dtype ou mesmo tipo python. O segundo parâmetro é "cópia". São necessários valores booleanos como entrada. Como padrão, true é usado. O valor da cópia deve ser verdadeiro para retornar uma cópia. O último parâmetro do método astype () é "erro". "Raise" e "ignorar" são possíveis. No entanto, "Raise" é a configuração padrão para este parâmetro.

Conversão de uma única coluna de um quadro de dados de pandas em um método ASTYPE ()

Nesta ilustração, alteraremos o tipo de dados de uma única coluna do DataFrame para int. Vejamos como funciona.

Primeiro, importe a biblioteca de pandas para o arquivo python e depois atribua o alias ao PD para aproveitar os recursos de pandas. Quando feito com ele, agora criamos um objeto de dados de dados e o nomeamos como "quadro", e atribuímos a saída de chamar a função DataFrame, que é usada para gerar um quadro de dados de pandas. O Pd.Função DataFrame inicializada com três colunas, "Student", "Marks" e "Points" é invocada. Atribuímos o mesmo comprimento dos valores para cada coluna do DataFrame. A função print () é utilizada para imprimir o quadro de dados de pandas.

Você pode ver o DataFrame com três colunas na imagem abaixo:

Depois que o DataFrame for criado com sucesso, verificaremos os tipos de dados para todas as colunas.

O tipo de dados do quadro de dados de pandas pode ser exibido usando a propriedade "dtypes". Para invocar esta propriedade, escreva o nome do objeto DataFrame que criamos acima com o “.Propriedade dtype ”; No nosso exemplo, é “quadro.dtypes ”. Portanto, ele verificará os tipos de dados para o DataFrame especificado. Como queremos ver os tipos de dados, temos que escrever “quadro.dtypes ”dentro da função Print ().

A função print () com a propriedade Dtypes obterá tipos de dados de todas as colunas do quadro de dados do "quadro".

Você pode visualizar a imagem de saída mostrando três colunas, tudo com o tipo de dados "objeto".

Aprenderemos agora a alterar o tipo de dados do DataFrame convertendo o tipo de dados predefinido para int. Para alcançar o tipo de dados desejado, temos que empregar o método "ASTYPE ()". Entre seus parênteses, fornecemos o tipo de dados para o qual queremos converter o tipo de dados anterior. Aqui vamos realizar a conversão do tipo de dados para apenas uma coluna.

A sintaxe para utilizar esse método é escrever o nome do objeto DataFrame com o nome da coluna dentro dos aparelhos longos “[]”. Coloque o operador de atribuição “=” então o objeto DataFrame com o mesmo nome da coluna com o “.a função astype () ”e dentro de seus aparelhos fornecem o tipo de dados necessário. Como no caso acima, temos “quadros ['marcas'].astype (int) ”. Isso significa que queremos converter o tipo de dados da coluna "Marks" de "Objeto" para "int". Por fim, exibiremos o Datatype atualizado para o quadro de dados "quadro", empregando a propriedade "Dtype" dentro da função Print ().

Isso nos produz a seguinte saída:

Conversão de mais de uma coluna de um quadro de dados de pandas em um método de ASTYPE ()

Como aprendemos a converter a coluna única dos pandas de um quadro de dados em um INT, agora vamos aprender a converter a conversão de dados de dados de várias colunas para int.

Usaremos o mesmo quadro de dados que preparamos no primeiro exemplo para esta instância. Com o objetivo de verificar o tipo de dados do DataFrame, a propriedade DTypes é usada. No exemplo anterior, fornecemos uma coluna que queríamos converter em um int; No entanto, onde precisávamos alterar o tipo de dados de mais de uma coluna. As colunas que escolhemos para alterar o tipo de dados são "Marcas" e "pontos".

Com o objeto DataFrame, damos o nome de ambas as colunas. E atribuiu a saída de invocar a função "ASTYPE ()". Definimos o tipo de dados como int no método astype (). Você pode escolher até 3 ou mais colunas conforme sua exigência de alterar o tipo de dados. Quando executamos o método print (), fornecemos o nome do objeto DataFrame com a propriedade DTYPE para que ele exiba o novo Datatype das colunas do DataFrame "quadro".

O terminal mostra uma saída que mantém um data de dados, o tipo de dados inicial e real de cada coluna do quadro de dados e, em seguida, exibe o tipo de dados atualizado das colunas "Marcas" e "pontos".

Exemplo 2: Converta a coluna Pandas para int, utilizando a função pandas to_numeric ()

Utilizando pandas para_numeric A função é uma das melhores técnicas para converter colunas únicas ou mais em um quadro de dados em valores numéricos. Este método tentará converter strings ou outros itens não numéricos em valores aceitáveis ​​de número inteiro ou de ponto flutuante.

Vamos ver sua implementação prática.

Para a demonstração deste método, criamos um dicionário "dados" que contém três cordas, "nome", "pontuação" e "tentativa". Nós empregamos os pandas.Método DataFrame () para converter esse ditado em um DataFrame e armazenar esse quadro de dados para um objeto de dados de dados "Demo". Em seguida, verificamos o Datatype do DataFrame pela propriedade dtype na função print (). Escolhemos a coluna "Score" cujo tipo de dados que queremos mudar para int. Em seguida, utilizamos a função Pandas to_numeric () e, dentro de seus aparelhos, fornecemos ao objeto DataFrame com o nome da coluna. Finalmente, a declaração de impressão com a propriedade DTYPE mostrará o tipo de dados atualizado do DataFrame.

Esta é a imagem de saída:

Conclusão

Neste artigo, tentamos familiarizá -lo com o conceito de converter o Datatype de um DataFrame em. Utilizamos duas funções de pandas para o referido propósito. Para a primeira abordagem, implementamos dois códigos práticos na ferramenta Spyder, bem como para a segunda ilustração. A prática tornará seus conceitos fortes e seu conhecimento crescerá melhor.