Pandas converte coluna em tempo de dados

Pandas converte coluna em tempo de dados
Os dados de séries temporais são frequentemente encontrados ao lidar com dados em pandas. Pandas é uma estrutura ideal para lidar com dados de séries temporais em Python. Com o conjunto de dados fornecido, podemos precisar girar a string para o formato DateTime. Pode ser necessário alterar a formatação de DateTime de uma coluna se atualmente armazenar os dados como uma string ou tipo de objeto. Numerosas ações temporais podem ser realizadas na coluna que emprega o formato DateTime. Por exemplo, você pode determinar a diferença de tempo entre duas datas e recuperar detalhes específicos, como o mês, ano etc.

Podemos alterar o formato de uma coluna de uma string ou mesmo um objeto para um tempo de dados empregando os métodos pandas to_dateTime () e astype (). Pode -se transformar um tempo de dados em um quadro de dados que possui uma coluna de string que é formatada de uma certa maneira, utilizando o método DateTime (), que reconhece o argumento do formato para definir a data e a hora do formato. O usuário não poderá executar funções baseadas em séries temporais sempre que as datas não forem inseridas no formato adequado. Devemos alterar as datas para o formato de data de data necessário para lidar com isso.

Este artigo abordará os métodos para converter uma coluna Pandas Dataframe com um objeto ou uma string em um tipo de dados do DateTime.

Exemplo # 1: Utilizando o PD.Método to_dateTime () para converter o tipo de coluna do quadro de dados de pandas de string para o datetime

Neste método, utilizaremos os “pandas.To_dateTime () ”Função para alterar o tipo de dados do tipo de dados de dados de dados de pandas da coluna.

Primeiro, importe a biblioteca para o programa Python. Em seguida, defina o alias como PD para usar a funcionalidade da biblioteca de pandas. O código principal começa com a criação de um objeto DataFrame "entrada". Em seguida, atribuímos a este objeto para a saída de chamar a função Pandas DataFrame. Construímos um quadro de dados utilizando os pandas.Método DataFrame (). Neste DataFrame, inicializamos três colunas: data, evento e custo.

Você pode ver que a coluna 'data' está armazenando dados em formato “dd/mm/yy” já. Então, não precisamos defini -lo. Em vez disso, podemos trabalhar em nossa tarefa necessária diretamente. Exibiremos o DataFrame que acabamos de criar empregando o método print ().

Depois que nosso DataFrame for criado com sucesso, verificaremos o tipo de dados para todas as colunas do DataFrame. Vamos usar o método Pandas Info () para observar o tipo de dados de valores em cada coluna.

A imagem de saída abaixo nos mostra um quadro de dados com 3 colunas e, em seguida, exibe o tipo de dados para todas as 3 colunas.

Como precisamos alterar o tipo de dados da coluna "Data", focaremos em seu tipo de dados atual que é 'objeto', string. Precisamos alterar seu formato de objeto para DateTime. Aqui estão os pandas.A função to_dateTime () nos permitirá converter o formato em DateTime:

Precisamos seguir esta sintaxe para empregar o PD.To_dateTime () função:

O nome do objeto DataFrame com o nome da coluna entre colchetes longos e o operador de atribuição "=", agora invocando os pandas.Método DATETime () com nome de dados de dados, tendo o nome da coluna como seus parâmetros. Em nossa ilustração, é “entrada ['data'] = pd.to_dateTime (entrada ['data']) ”.

Depois que essa função é invocada, a próxima chamada é para a função Pandas Info () para ver os tipos de dados atualizados do DataFrame.

O terminal mostra a saída do programa acima executado com a coluna 'Data' Convert Datatype do objeto para o DateTime.

Exemplo # 2: Utilizando o quadro de dados de pandas.Método ASTYPE () para converter o tipo de coluna do quadro de dados de pandas de string para DateTime

Outro método para converter o Datatype da coluna DataFrame em DateTime é utilizar o quadro de dados de pandas.função astype ().

Utilizamos o quadro de dados que produzimos no último exemplo para criar esta ilustração. Com as mesmas três colunas do DataFrame, nós as armazenamos no objeto DataFrame. E exibi -lo usando a função print ().

Vamos ver a imagem de saída para o programa.

A coluna 'data' e a 'Evento' possuem tipo de dados de objeto enquanto a coluna 'custo' possui intatatype int int. A conversão do Datatype será feita na coluna 'Date', enquanto discutimos a modificação da coluna no DatETime Datatypey.

Demonstraremos como alterar o tipo de dados da coluna DataFrame "Date" do objeto para o formato DateTime. Mas desta vez estamos empregando o método Pandas DataFrame.ASTYPE () para o referido propósito.

No instantâneo do código acima, usamos o método astype () da biblioteca de pandas. A sintaxe que seguimos para a execução deste método é o nome do objeto DataFrame com o nome da coluna que você deseja converter para o formato DateTime, entre colchetes longos, após o operador de atribuição "=", novamente o mesmo nome do quadro de dados e Nome da coluna com “.função astype () ”.

Entre os parênteses do método astype (), você deve especificar o tipo de dados necessário. Como precisamos convertê -lo para o DataTyType DATETime, fornecemos "DateTime64 [ns])" Datatype. Por fim, exibimos os tipos de dados invocando o método info ().

Isso nos produz o seguinte resultado:

Exemplo # 3: Utilizando os pandas.To_date () Método para converter o tipo de dados em tempo e alterar o formato da coluna Pandas Dataframe

Suponha que precisamos alterar uma coluna de quadro de dados de 'yymmdd' para 'yyyy-mm-dd', esta ilustração o guiará para alcançar o resultado.

Inicie o programa novamente importando a biblioteca de pandas como PD para acessar os recursos de pandas. Na próxima etapa, criamos uma lista de dicionário "Plist" e atribuímos um conjunto de dados com 2 conjuntos de valores. Em seguida, para converter esta lista em um DataFrame, criamos um objeto DataFrame "Novo" e atribuímos a saída de chamar o PD.Função DataFrame (). Passamos o nome da lista e a propriedade "Colunas", dadas duas colunas denominadas 'datas' e 'compromissos', como o parâmetro do PD.Função DataFrame () para construir um DataFrame com 2 colunas. Em seguida, invocamos a função "print ()" para exibir esse quadro de dados. Também empregamos outra impressão () com a propriedade "dtypes" para determinar o tipo de dados das colunas do DataFrame.

O instantâneo tirado do terminal de saída abaixo mostra o quadro de dados com 2 colunas e especificar explicitamente o tipo de dados de cada coluna.

Na imagem acima, você pode ver que o tipo de dados da coluna 'datas' é definido como um objeto.

Usamos o PD.To_DateTime () Função com a mesma sintaxe que explicamos no primeiro exemplo com uma adição aos parâmetros desta vez. Com o nome do nome de dados e o nome da coluna, também usamos o parâmetro 'formato' nesta ilustração para especificar o formato em que queremos que a coluna 'datas' seja exibida. Definimos o estilo "formato = '%y%m%d'". Agora estaremos exibindo o quadro de dados e também os tipos de dados das colunas de dados de dados.

Aqui está a saída com formatos anteriores e atualizados da coluna "datas" e também o tipo de dados convertido para esta coluna específica:

Conclusão

O módulo Pandas do Python fornece vários recursos para facilitar para os programadores trabalharem no processamento de dados. O método pandas “PD.to_dateTime () ”e“ DataFrame.astype () ”foi discutido para a conversão de string datatype em um datetime. Explicamos as técnicas com o auxílio de exemplos práticos de código python implementados no Spyder para tornar seu processo de aprendizagem suave e consistente com conceitos fáceis de gritar.