PANDAS ASTYPE

PANDAS ASTYPE
O objeto Pandas é normalmente lançado para um dtype específico.função astype () usando o método astype (). Esta ferramenta também pode alterar qualquer coluna elegível para um tipo categórico. Nós o usamos quando desejamos converter um tipo de dados específico da coluna em outro tipo de dados. A entrada para o dicionário Python também pode ser usada para alterar vários tipos de coluna simultaneamente. O nome da coluna e os novos tipos de dados que desejamos usar nas colunas são representados no dicionário pelos rótulos de chave e valores, respectivamente. A técnica do Pandas ASTYPE tem várias aplicações.

Esta ferramenta nos permite modificar o tipo de dados de:

  1. Uma série de pandas
  2. Cada coluna em um quadro de dados de pandas
  3. Várias colunas em um quadro de dados

Como usar a função astype () em pandas

Para usar a função ASTYPE (), devemos primeiro entender sua sintaxe. Os objetos da série e os quadros de dados podem ser usados ​​com o método astype. A sintaxe para astype na série e astype nas colunas do DataFrame são as seguintes:

Sintaxe da função astype () na série

Basta digitar o nome da série seguido pela “Sintaxe do Dot” da ASTYPE () para invocar o método para uma série.

Sintaxe:

Sintaxe da função ASTYPE () em colunas DataFrame

Devemos primeiro digitar o nome do quadro de dados antes de chamar o método ASTYPE () de "sintaxe do DOT".

Sintaxe:

Quadro de dados.astype (dtype, cópia = true, erros = "raise", ** kwargs)

dtype: O objeto Pandas é fundido para o mesmo tipo usando o tipo Python ou Numpy.dtype. Uma ou mais colunas do quadro de dados podem ser lançadas em tipos específicos da coluna. Também é possível usar col: dtype,? Como alternativa, onde Col representa o nome da coluna e o dtype é um Numpy.

cópia de: Fornece uma cópia se cópia = true. Quando cópia = false, temos que ter cuidado, pois as mudanças nos valores podem se espalhar para outros objetos de pandas.

erro: Se você tentar aplicar um tipo de dados incorreto ou inválido no objeto, a técnica aumentará uma exceção ou não, dependendo do valor do parâmetro de erro. As duas respostas a isso são as seguintes:

elevação(Se houver um problema, ele levantará uma exceção)

ignorar (Se houver um problema, ele suprimirá exceções. ele retornará o objeto original se houver um erro)

Na função astype () raise = true por padrão.

Kwargs: O construtor recebe um argumento de palavra -chave (kwargs) como uma entrada.

Agora vimos a sintaxe. Ensinaremos o uso da função ASTYPE () nos exemplos a seguir.

Exemplo 1: Alterando o Datatype de série de pandas

Primeiro de tudo, importaremos módulos de pandas, então usaremos a função DataFrame () para criar o conjunto de dados, passando um dicionário de nomes de colunas e algumas listas que contêm as informações que queremos que as variáveis ​​mantenham:

Além disso, criaremos uma série que detém apenas a variável de despesas do quadro de dados:

Para ilustrar nosso quadro de dados, usaremos a função print ().

Existem quatro variáveis: nome, país, vendas e despesas. Como resultado, o DataFrame inclui informações de vendas e despesas de amostra ou boatos para alguns indivíduos de diferentes países.

Vamos verificar o tipo de dados de nossa série chamado e_variable usando dtype.

Isso indica que nossa série E_Variable tem o tipo de dados "objeto". Agora mudaremos o tipo de dados da série para Int64 usando pandas astype.

O tipo de dados da saída é dtype: int64, como você pode ver se presta muita atenção ao fundo da saída. Lembre -se de que a variável E não foi modificada diretamente por isso. Como a saída do ASTYPE () foi impressa no console, a série E_Variable ainda possui o tipo de dados de "objeto". Teríamos que reatribuir a saída para o nome da variável real com o código a seguir, se quiséssemos alterar os dados permanentemente diretamente:

Agora, o tipo de dados de nossa série é alterado permanentemente.

Exemplo 2: Alterando o Datatype da coluna DataFrame

Agora iremos operar na coluna de um quadro de dados. Comparando isso com o Exemplo 1, onde trabalhamos com uma série de pandas, será um pouco diferente. Nesse caso, vamos trabalhar com um dataframe. Portanto, a sintaxe diferirá um pouco. Primeiro, verificaremos o tipo de dados atual do nosso DataFrame S_DATA. Para verificar o tipo de dados do DataFrame, usaremos o DTYPE.

Para examinar os tipos de dados da saída, também usaremos o .atributo dtypes.

Você verá que o tipo de dados da venda foi modificado para o INT64 na saída. Para conseguir isso, usamos a função astype, passando um argumento de um dicionário. O nome da coluna aparece no lado esquerdo do dicionário, e o novo tipo de dados aparece à direita. Vamos alterar o tipo de dados de outra coluna de nosso quadro de dados.

O tipo de dados da coluna da nação foi completamente transformado em "string", como você pode ver.

Exemplo 3: Alteração do Datatype de várias colunas em um DataFrame

Vamos agora alterar o tipo de dados de várias das colunas do quadro de dados. Isso pode ser feito de uma maneira bastante semelhante à maneira como mudamos a coluna no Exemplo 2. Vamos empregar um dicionário diferente neste exemplo.

Mais uma vez, vamos examinar os tipos de dados originais com o uso do .atributo dtype antes de fazer a operação:

Mais uma vez, observe que o objeto é o tipo de dados de todas as colunas no DataFrame.

Agora vamos modificar o tipo de dados de várias colunas. Para conseguir isso, criaremos um dicionário com o nome e o tipo de dados da variável como seus pares "chave" e "valor". Após o atributo ASTYPE, também ligaremos para o .atributo dtypes para que possamos observar os novos tipos de dados.

Você verá que os tipos de dados de três colunas mudaram na saída. O tipo de dados da coluna do país é alterado para string, o tipo de dados de vendas é alterado para int64 e o tipo de dados de despesas é alterado para int32.

Nos parênteses, adicionamos um dicionário e invocamos o método astype. Alguns pares de chave/valor com o formato "coluna": "Datatype" estavam no dicionário. Os novos tipos de dados e os nomes das colunas só precisam ser fornecidos em um dicionário.

Exemplo 4: Faça com que os dados de dados de todas as colunas em um quadro de dados

O padrão do método pandas astype () tenta lançar todas as colunas de quadro de dados para os tipos de python (int, texto, flutuação, data e datetime) ou numpy.dtype que são fornecidos. A operação falha e o erro “ValueError: Literal inválido” é aumentado se alguma coluna não puder ser lançada devido a dados inválidos ou NAN. Para este exemplo, vamos criar um novo DataFrame a partir de dicionários.

Todos os nomes e dtypes da coluna DataFrame são retornados pelo DataFrame.função dtypes. Lembre -se de que cada coluna tem um tipo de objeto no quadro de dados mostrado acima. Agora, lançaremos o tipo de dados para string.

Como visto anteriormente, o dtype é atualizado para todas as colunas do DF DataFrame DF.

Conclusão

Neste tutorial, tentamos ensiná -lo a usar o quadro de dados do Python Pandas.método astype (). Alteramos o tipo de dados da coluna do quadro de dados para um tipo de dados diferente e depois examinamos o DataFrame. Implementamos alguns exemplos neste artigo, para que você possa alterar o tipo de dados de dados da série e o tipo de dados da coluna de dados usando o método pandas astype no python.