Pandas Rolling Signal

Pandas Rolling Signal

“A funcionalidade de computação da janela rolante é fornecida pelo Pandas“ DataFrame.Rolling ().Método médio () ”. A média de um número especificado de intervalos anteriores em uma série temporal é conhecido como um meio rolante.”

A sintaxe a seguir pode ser usada para determinar a média de rolamento para colunas únicas ou múltiplas em um quadro de dados de pandas:

Vamos explorar diferentes técnicas para empregar este método nesta lição.

Exemplo 1

Nesta ilustração, utilizaremos os pandas “df.Rolling ().método mean () ”para calcular a média do rolamento de uma única coluna.

Primeiro temos que pegar os requisitos para a compilação do código. Precisamos de algum software que nos forneça um ambiente suportado por Python para compilar nosso script Python. Instalamos a ferramenta "Spyder" em nosso sistema. Depois de lançar a ferramenta, podemos acessar a interface.

Começando com o programa, inicialmente precisamos carregar a biblioteca essencial. O método "rolling ()" no qual nosso artigo se baseia é a função de pandas. Portanto, para usar esse método em nosso programa, temos que importar a biblioteca "pandas" e criar "PD" como o pseudônimo para "pandas".

Depois que o pré -requisito foi alcançado, temos que gerar um quadro de dados de pandas usando o “PD.DataFrame () ”Módulo fornecido pelo Pandas Toolkit. O “PD.O método DataFrame () "é chamado com 4 colunas que especificamos como" verão "," inverno "," outono "e" primavera ". Cada coluna armazena 8 valores. Os valores identificados para a coluna "verão" são "200", "130", "280", "100", "270", "360", "120" e "311". A coluna "inverno" tem esses valores "12", "34", "54", "67", "98", "45", "78" e "43". A terceira coluna, "outono", tem valores como "12", "13", "42", "32", "71", "61", "77" e "89". Para a coluna "Spring", os valores são "10", "29", "78", "44", "76", "55", "32" e "22".

O “PD.Dataframe () ”, quando invocado, constrói um quadro de dados usando esses valores fornecidos. Em seguida, ele precisa de um espaço de armazenamento onde possa colocar esse quadro para uso posterior. O recém -criado DataFrame agora está acessível ao mencionar o objeto "estação". O próximo requisito é mostrar esse quadro de dados na tela para que possamos vê -lo corretamente. Para isso, empregamos o método "print ()" de Python. Entre seus parênteses, fornecemos a entrada que precisa ser exibida. Aqui fornecemos o objeto "estação" como uma entrada para o método "print ()" para exibir seu conteúdo.

Para executar o script acima mencionado, precisamos pressionar a opção "Run File"; Como alternativa, você também pode pressionar as teclas “Shift+Enter” para executar o código. Isso nos fornece um quadro de dados com 4 colunas e 8 linhas. A lista de índices começa de "0" por padrão e termina em "7".

Agora vamos exercer o método Pandas "rolling ()" para calcular o rolamento estimado de uma única coluna no DataFrame fornecido. Vamos aprender a conseguir isso.

Nós invocamos o “df.Rolling () ”Método. O nome do DataFrame "Temporada" com o ".Rolling () ”Método está escrito. Como queremos obter a janela rolante para o cálculo da média de rolamento de uma única coluna, temos que especificar o nome da coluna com o nome do DataFrame. A coluna que escolhemos aqui é a coluna "verão" do quadro de dados da "temporada". Entre os suportes redondos do método "rolling ()", definimos o valor "3". Isso significa que queremos calcular o rolamento da coluna "verão".

O ".A função média () ”calculará a média para o rolamento de 3 dias do“ verão ”. Queremos armazenar essa média estimada da coluna "verão" em uma nova coluna. Então, para criar uma nova coluna, escrevemos o nome do DataFrame, operador subscrito e o nome do novo coluna como "Summer_rolling". Nós atribuímos o resultado da “temporada [“ verão ”].Rolling (3).MEAU () ”função. Portanto, a média do rolamento por 3 dias dos valores da coluna "verão" será armazenada na coluna "Summer_rolling". Por fim, imprima o quadro de dados invocando o método "print ()".

No instantâneo rendido, podemos ver que as duas primeiras entradas que obtemos são valores nulos. Isso ocorre porque não podemos estimar a média do rolamento, pois só pode ser calculado quando temos uma janela de 3 dias, mas para os dois primeiros registros, não temos nenhum valores anteriores para concluir o Windows especificado; Portanto, os valores de nan são retornados. Nos 3rd Linha, temos um valor “203.333333 ”, que é o rolamento médio para os 3 dias.

Exemplo # 2

Aprendemos a encontrar a média rolante de uma coluna em um quadro de dados de pandas. A média de rolamento também pode ser calculada para várias colunas. Para várias colunas, temos que invocar o método médio de rolamento separadamente para cada coluna.

Vamos exercer o método de rolamento no quadro de dados gerado anteriormente para estimar a média de rolamento de várias colunas. O “df.Rolling ().o método médio () ”é invocado. Invocamos esse método duas vezes porque queremos calcular a média de rolamento para duas colunas. O primeiro “rolling ().O método médio () ”é chamado de DataFrame e nome da coluna como“ Temporada ['Summer'] ”e o valor para os dias de rolamento é especificado“ 4 ”.

Para armazenar a média de rolagem calculada em outra coluna, inicializamos uma coluna “Summer_rolling”. Isso significa que queremos calcular a média de rolagem para uma janela de 4 dias da coluna "verão" e armazenar o resultado na coluna "Summer_rolling". Então nós empregamos o 2nd “DF.Rolling ().Método médio () ”. A coluna que selecionamos aqui é "outono" e a janela rolante é especificada como "4". Para salvar os cálculos, criamos uma coluna "Autumn_rolling" no DataFrame existente "Temporada". O método "print ()" exibirá a saída final no console python.

Na tela de saída, pode -se examinar que 2 novas colunas foram adicionadas ao quadro de dados. As colunas "Summer_rolling" e "Autumn_rolling" mantêm uma média estimada de rolamento para as colunas "verão" e "outono", respectivamente, respectivamente. Os três primeiros valores em ambas. Do 4º entrada, ele recebe seu primeiro valor médio de rolamento.

Exemplo # 3

A média rolante de todas as colunas no quadro de dados é calculada usando os pandas “df.Rolling ().Médico () ”” como a etapa final.

Para calcular a média rolante de todas as colunas, não precisamos mencionar o nome de qualquer coluna especificamente. Nós invocamos o “df.Rolling ().a função mean () ”simplesmente fornecendo o nome do quadro de dados como" estação "e o valor da janela rolante como" 5 ". Para preservar o resultado, criamos uma variável "resultado". O “rolling ().O método médio () ”calculará a média de rolamento da“ estação ”de quadro de dados, tomando uma janela de 5 dias e armazenando o resultado na cópia do quadro de dados usando a variável“ resultado ”. Utilizamos o método "print ()" de python para exibir o novo DataFrame.

Isso nos dá o quadro de dados com uma média estimada de rolamento para uma janela de 5 dias.

Conclusão

Cálculo da média de rolamento para a janela especificada em um quadro de dados é uma abordagem simples. Nós utilizamos os pandas “df.Rolling ().método mean () ”para estimar a média de rolamento neste tutorial. Três estratégias diferentes foram discutidas para encontrar a média de rolamento em um quadro de dados. A primeira ilustração é baseada no calcário da média rolante de uma única coluna, o 2nd Exemplo fornece a idéia de calcular a média de rolamento para várias colunas, e a última instância passou brevemente encontrando a média de rolamento de todas as colunas presentes no quadro de dados. Todas as técnicas foram praticamente implementadas na ferramenta Spyder.