Esta ferramenta nos permite modificar o tipo de dados de:
Como usar a função astype () em pandas
Para usar a função ASTYPE (), devemos primeiro entender sua sintaxe. Os objetos da série e os quadros de dados podem ser usados com o método astype. A sintaxe para astype na série e astype nas colunas do DataFrame são as seguintes:
Sintaxe da função astype () na série
Basta digitar o nome da série seguido pela “Sintaxe do Dot” da ASTYPE () para invocar o método para uma série.
Sintaxe:
Sintaxe da função ASTYPE () em colunas DataFrame
Devemos primeiro digitar o nome do quadro de dados antes de chamar o método ASTYPE () de "sintaxe do DOT".
Sintaxe:
Quadro de dados.astype (dtype, cópia = true, erros = "raise", ** kwargs)
dtype: O objeto Pandas é fundido para o mesmo tipo usando o tipo Python ou Numpy.dtype. Uma ou mais colunas do quadro de dados podem ser lançadas em tipos específicos da coluna. Também é possível usar col: dtype,? Como alternativa, onde Col representa o nome da coluna e o dtype é um Numpy.
cópia de: Fornece uma cópia se cópia = true. Quando cópia = false, temos que ter cuidado, pois as mudanças nos valores podem se espalhar para outros objetos de pandas.
erro: Se você tentar aplicar um tipo de dados incorreto ou inválido no objeto, a técnica aumentará uma exceção ou não, dependendo do valor do parâmetro de erro. As duas respostas a isso são as seguintes:
elevação(Se houver um problema, ele levantará uma exceção)
ignorar (Se houver um problema, ele suprimirá exceções. ele retornará o objeto original se houver um erro)
Na função astype () raise = true por padrão.
Kwargs: O construtor recebe um argumento de palavra -chave (kwargs) como uma entrada.
Agora vimos a sintaxe. Ensinaremos o uso da função ASTYPE () nos exemplos a seguir.
Exemplo 1: Alterando o Datatype de série de pandas
Primeiro de tudo, importaremos módulos de pandas, então usaremos a função DataFrame () para criar o conjunto de dados, passando um dicionário de nomes de colunas e algumas listas que contêm as informações que queremos que as variáveis mantenham:
Além disso, criaremos uma série que detém apenas a variável de despesas do quadro de dados:
Para ilustrar nosso quadro de dados, usaremos a função print ().
Existem quatro variáveis: nome, país, vendas e despesas. Como resultado, o DataFrame inclui informações de vendas e despesas de amostra ou boatos para alguns indivíduos de diferentes países.
Vamos verificar o tipo de dados de nossa série chamado e_variable usando dtype.
Isso indica que nossa série E_Variable tem o tipo de dados "objeto". Agora mudaremos o tipo de dados da série para Int64 usando pandas astype.
O tipo de dados da saída é dtype: int64, como você pode ver se presta muita atenção ao fundo da saída. Lembre -se de que a variável E não foi modificada diretamente por isso. Como a saída do ASTYPE () foi impressa no console, a série E_Variable ainda possui o tipo de dados de "objeto". Teríamos que reatribuir a saída para o nome da variável real com o código a seguir, se quiséssemos alterar os dados permanentemente diretamente:
Agora, o tipo de dados de nossa série é alterado permanentemente.
Exemplo 2: Alterando o Datatype da coluna DataFrame
Agora iremos operar na coluna de um quadro de dados. Comparando isso com o Exemplo 1, onde trabalhamos com uma série de pandas, será um pouco diferente. Nesse caso, vamos trabalhar com um dataframe. Portanto, a sintaxe diferirá um pouco. Primeiro, verificaremos o tipo de dados atual do nosso DataFrame S_DATA. Para verificar o tipo de dados do DataFrame, usaremos o DTYPE.
Para examinar os tipos de dados da saída, também usaremos o .atributo dtypes.
Você verá que o tipo de dados da venda foi modificado para o INT64 na saída. Para conseguir isso, usamos a função astype, passando um argumento de um dicionário. O nome da coluna aparece no lado esquerdo do dicionário, e o novo tipo de dados aparece à direita. Vamos alterar o tipo de dados de outra coluna de nosso quadro de dados.
O tipo de dados da coluna da nação foi completamente transformado em "string", como você pode ver.
Exemplo 3: Alteração do Datatype de várias colunas em um DataFrame
Vamos agora alterar o tipo de dados de várias das colunas do quadro de dados. Isso pode ser feito de uma maneira bastante semelhante à maneira como mudamos a coluna no Exemplo 2. Vamos empregar um dicionário diferente neste exemplo.
Mais uma vez, vamos examinar os tipos de dados originais com o uso do .atributo dtype antes de fazer a operação:
Mais uma vez, observe que o objeto é o tipo de dados de todas as colunas no DataFrame.
Agora vamos modificar o tipo de dados de várias colunas. Para conseguir isso, criaremos um dicionário com o nome e o tipo de dados da variável como seus pares "chave" e "valor". Após o atributo ASTYPE, também ligaremos para o .atributo dtypes para que possamos observar os novos tipos de dados.
Você verá que os tipos de dados de três colunas mudaram na saída. O tipo de dados da coluna do país é alterado para string, o tipo de dados de vendas é alterado para int64 e o tipo de dados de despesas é alterado para int32.
Nos parênteses, adicionamos um dicionário e invocamos o método astype. Alguns pares de chave/valor com o formato "coluna": "Datatype" estavam no dicionário. Os novos tipos de dados e os nomes das colunas só precisam ser fornecidos em um dicionário.
Exemplo 4: Faça com que os dados de dados de todas as colunas em um quadro de dados
O padrão do método pandas astype () tenta lançar todas as colunas de quadro de dados para os tipos de python (int, texto, flutuação, data e datetime) ou numpy.dtype que são fornecidos. A operação falha e o erro “ValueError: Literal inválido” é aumentado se alguma coluna não puder ser lançada devido a dados inválidos ou NAN. Para este exemplo, vamos criar um novo DataFrame a partir de dicionários.
Todos os nomes e dtypes da coluna DataFrame são retornados pelo DataFrame.função dtypes. Lembre -se de que cada coluna tem um tipo de objeto no quadro de dados mostrado acima. Agora, lançaremos o tipo de dados para string.
Como visto anteriormente, o dtype é atualizado para todas as colunas do DF DataFrame DF.
Conclusão
Neste tutorial, tentamos ensiná -lo a usar o quadro de dados do Python Pandas.método astype (). Alteramos o tipo de dados da coluna do quadro de dados para um tipo de dados diferente e depois examinamos o DataFrame. Implementamos alguns exemplos neste artigo, para que você possa alterar o tipo de dados de dados da série e o tipo de dados da coluna de dados usando o método pandas astype no python.