PANDAS DAT RANGE

PANDAS DAT RANGE
Os dados de séries temporais são conjuntos de dados acumulados em intervalos de tempo periódicos ou contínuos. Os dados da série temporal são usados ​​para rastrear uma previsão de longo prazo, detectar um padrão dependente do tempo ou rastrear sazonalidade.

O módulo de manipulação e análise de dados do Python é bem reconhecido. Os pandas oferecem um método chamado "date_range ()" que pode produzir uma variedade de datas ou intervalos de tempo. Se você estiver lidando com dados de séries temporais, o panda "date_range ()" é uma ótima maneira de agrupar datas por dias, semanas ou meses.

Método pandas date_range ()

O “PD.date_range () ”é uma das funções padrão dos pandas que retorna uma frequência definida“ DateTimeIndex ”.

Este método pode ser usado na seguinte sintaxe:

Descreveremos brevemente os parâmetros desta função aqui.

O primeiro parâmetro da sintaxe mostrado no instantâneo anterior é "começar". Para construir o intervalo de data, esse argumento é usado para especificar o limite inferior ou esquerdo. O "fim" é o limite superior ou direito para produzir o intervalo de data. O "período" Define os números do período ou os números de data desejada. O "frequencia" é o intervalo (tamanho da etapa) entre duas datas sucessivas. O "TZ" é o fuso horário das datas. As vezes são ingênuas por padrão, sem conceito de fuso horário. O "normalizar" é usado para normalizar as datas de início e final a meia -noite antes de produzir um intervalo de data. O "nome" é o nome do DateTimeIndex que retorna. O "fechado" O parâmetro fecha o intervalo para a 'esquerda, "direita" ou ambos os lados da frequência fornecida. Sua configuração padrão é "nenhum".

Neste artigo, explicaremos a execução dos códigos Python com alguns desses parâmetros do “PD.date_range () ”.

Exemplo # 1: Utilizando PD.Método date_range () para gerar um intervalo básico

Neste exemplo, você usará o uso básico do método pandas “PD.date_range () ”para produzir um intervalo de data com dias individuais. Vamos começar.

Para iniciar a execução desta ilustração, precisamos ter uma plataforma onde possamos implementar os códigos python. De todas as opções sobre as ferramentas ou software que nos fornecem o ambiente de suporte do Python, decidimos escolher a ferramenta "Spyder". Esta ferramenta deve ser baixada e instalada no sistema com o qual você está trabalhando. Você pode estar usando um sistema operacional Windows ou Linux; Todos os sistemas operacionais suportam. Você precisa baixar a configuração subsequente. Ao atingir o ícone da ferramenta, a interface é lançada. Agora, configuramos tudo o necessário para executar o código. Para começar a escrever o script, lançamos um novo arquivo Python escolhendo a opção "Novo arquivo" ou simplesmente segurando e liberando as teclas "Ctrl+N" juntas. O arquivo é aberto com o “.extensão py ”, que se refere ao diretório Python.

Agora começamos a escrever nosso código python nele. O título deste tutorial pode ter dado a você uma dica de que trabalharemos em alguns recursos de pandas. "Pandas" é uma biblioteca de Python. Para usar a função de qualquer biblioteca, devemos primeiro carregar essa biblioteca no arquivo. Então, primeiro carregamos a biblioteca de pandas usando o script “Importar pandas como PD”. Isso importará todos os recursos do Pandas para o arquivo python. Agora, eles são acessíveis a nós usando "PD". Nosso código principal começa aqui.

Nós usamos o “PD.Método date_range () ”fornecido pela Biblioteca Pandas para criar um intervalo básico. Entre os parênteses desta função, usamos dois parâmetros, "Start" e "End". O parâmetro "Start" especifica de onde o intervalo será iniciado, que fornecemos "start = '2/2/2022'" ". O parâmetro "final" leva o salto mais baixo, onde o intervalo de data terminará, que definimos "end = '2/12/2022'" ". Portanto, o intervalo de data começará no 2nd de fevereiro de 2022 e termina nos 12º de fevereiro de 2022, criando um intervalo de data de 10 dias.

Para armazenar a saída gerada a partir da invocação do “PD.Método Date_Range () ”, criamos uma variável“ display ”. Agora o intervalo de data é armazenado nesta variável. Para exibir esse intervalo de data no console python, precisamos chamar o método python de "print ()". Isso mostrará a saída armazenada na variável "Display" na forma de DateTimeIndex.

Quando executamos esse código usando a opção "Run File" na ferramenta "Spyder", o console nos mostra um intervalo de 10 dias. Todas as datas de "2/2/2022" a "12/2/2022" foram exibidas uma por uma. A aplicação mais simples desta técnica é esta.

Exemplo # 2: Utilizando o PD.Método date_range () para gerar um intervalo de data com um período especificado

Esta ilustração demonstrará como gerar um intervalo de data com um número definido de períodos uniformemente distribuídos entre um início especificado e a data de término.

Primeiro, importamos a biblioteca de pandas como “Importar pandas como PD”. Para criar um intervalo, o “PD.o método date_range () ”é invocado. Utilizamos este método com três parâmetros para esta ilustração. Esses parâmetros são "iniciantes", "fim" e "período". O parâmetro "Start" está definido para iniciar o intervalo de data a partir de "6/6/2022" e o parâmetro "final" é especificado para encerrar o intervalo de data em "16/04/2022". O terceiro parâmetro aqui é o "período", que criará um padrão de datas com o comprimento fornecido de "6" em nosso exemplo.

Criamos um "intervalo" variável para armazenar o intervalo gerado a partir do "PD.date_range () ”. Agora temos que exibir o resultado no console. Para isso, empregamos a função "print ()".

O intervalo de data com um período de 6 gerado a partir do “PD.O método date_range () ”é exibido no console quando executamos o programa anterior.

Exemplo # 3: Utilizando PD.Método date_range () para gerar um intervalo com frequência específica

O intervalo de data também pode ser gerado especificando uma frequência específica. Vamos ver nesta ilustração.

Conforme mencionado nos exemplos anteriores, o primeiro e principal requisito para o código aqui é importar a biblioteca relevante, que é pandas. Então nós invocamos o “PD.Método date_range () ”para criar um intervalo de data. Invocamos esta função com três parâmetros "Start", "Freq" e "Período". Especificamos o intervalo de data de início como "11/11/2022" e, em seguida, fornecemos a frequência, que é o intervalo entre duas datas consecutivas. Por padrão, ele está definido como "D", mas aqui especificamos para "MS", criando intervalos entre cada mês.

O último parâmetro que usamos aqui é "período" e está definido como "8". Isso significa que um intervalo de data será gerado a partir da data especificada até o período de 8, levando uma frequência de um mês. Criamos uma variável "mês" para armazenar a saída e, finalmente, a função "print ()" é invocada para imprimir o intervalo de data.

Isso produz o intervalo de dados de saída de oito períodos criados na frequência de um mês a partir da data especificada.

Conclusão

Este tutorial é baseado em um conceito muito útil e importante de pandas sobre a criação de um intervalo. Explicamos a ideia de configurar um intervalo em Python. Os pandas “PD.O método date_range () ”é a melhor abordagem a ser usada para esse fim. Este método nos fornece uma variedade de parâmetros usados ​​de acordo com a necessidade. Implementamos esse método praticamente na ferramenta "Spyder" e também elaboramos em todas as etapas que demos durante o processo de execução. Seguir cada etapa ajudaria você a gerar o resultado da faixa de data desejada.