Pandas interpolam

Pandas interpolam
Interpolação é uma maneira de estimar os dados desconhecidos entre os dois valores conhecidos dos dados. O método Pandas "Interpolate" é usado para preencher as qualidades ausentes no quadro de dados. Não é a melhor versão para encontrar os dados ausentes ou desconhecidos, pois às vezes afetam a precisão dos dados e podem ter erros de curto prazo. Mas há um "polinomial", que é um tipo de interpolado de pandas, que é usado de várias maneiras. Python 'Pandas é uma linguagem muito útil para o trabalho relacionado a dados. Usaremos a ferramenta “Spyder” para a implementação dos códigos, que é um software amigável baseado em idiomas Python. A interpolação de pandas pode ser feita em diferentes métodos, temos que saber qual trabalho temos que fazer. Com esse conhecimento, implementaremos o método de acordo, que discutiremos com exemplos e explicações completas.

Tipos de pandas interpolados

A seguir estão as três maneiras pelas quais a interpolação dos pandas pode ser feita:

  • Interpolação linear de pandas (para frente, para trás, ambos, coluna única, eixo, preenchimento e polinomial).
  • Interpolação de pandas polinomiais.
  • Interpolação de pandas através do preenchimento.

Existem alguns parâmetros que são os seguintes:

limite_direction

“Avançar”, “para trás”, “ambos”

A direção limite é por padrão, definida como "para a frente", o que significa que, se não especificarmos o método, ele acompanhará o método de interpolação direto.

Criando o quadro de dados para a implementação do método de interpolada de pandas

Primeiro, estaremos focados em criar o DataFrame "DF". Nós importamos a biblioteca de pandas como "PD", que é uma biblioteca de código aberto para manipular os dados. Em seguida, começaremos a criar o "DF" usando o software "Spyder", onde temos os dados como em quatro variáveis ​​chamadas, "W", "X", "Y" e "Z". Todos eles têm valores separados atribuídos, como "W", que tem os valores "18", "5", "9", "3", "nenhum". "X" tem os valores "nenhum", "89", "4", "8" e "Nenhum". "Y" tem os valores "30", "Nenhum", "7", "9", "12". Da mesma forma, "Z" com os valores "11", "nenhum", "66", "5" e "8".

Aqui, no código acima, o quadro de dados que pode ser escrito como "df" é criado. Na primeira linha de código, a biblioteca de pandas é importada como "PD". Em seguida, o DataFrame é criado no qual atribuímos as variáveis ​​"W", "X", "Y" e "Z", dadas a cada um deles cinco valores atribuídos. O "nan" no código significa "não um número".

A saída mostra os valores dos dados do quadro à medida que os atribuímos no código. Existem os números de série, depois as variáveis, desativando os valores conforme atribuído.

Exemplo 01: Método de interpolação linear de pandas lineares

Na interpolação linear, o método interpolate () funciona como os pontos próximos à esquerda e à direita, depois que a estimativa é feita. Presume -se que esses pontos estejam no ponto de encontro desconhecido. Como mencionado acima nos parâmetros, se não especificarmos o parâmetro, então, por padrão, ele é executado como o método interpolado direto. O código abaixo é um exemplo claro do padrão. Aqui, pegamos as variáveis ​​como "S", "T",, U "e" V "com seus valores atribuídos para o DataFrame. Ainda assim, se quisermos especificar por conta própria, podemos ir com o mesmo código. Basta acrescentar, após a última linha de código, df. interpolate () pode ser escrito com a direção limite, especificando -o como "para a frente", para que pareça: "DF.Interpolate (limite_direction = 'Forward') ".

A saída abaixo mostra a interpolação direta do código acima. Quanto aos detalhes fornecidos, o padrão funciona como "interpolação para a frente", e é por isso que o T (0) está mostrando o valor nulo.

Exemplo 02: Método de interpolação linear de pandas lineares

Se queremos fazer a interpolação linear para trás, podemos fazer isso da mesma forma, como fizemos acima na interpolação para a frente. Temos que dar a direção limite como "para trás", desta vez, como mostrado no código. Aqui, as variáveis ​​em que estaremos trabalhando para o DF são: "D", "Q", "B" e "J" com seus valores atribuídos.

A saída do método de interpolação () para trás, o Q (4) é nulo devido ao método de interpolação reversa realizado.

Exemplo 03: Ambos os métodos lineares de interpolação de pandas

Agora aqui, e se quisermos fazer o dia adiante e para trás, ambos no mesmo código? É possível e podemos fazer isso simplesmente usando o método de interpolação “ambos”. Aqui, para o "df", temos as variáveis ​​"P", "U", "O" e "M" com os valores correspondentes atribuídos.

A saída a seguir consiste em ambos, o método de interpolação para frente e para trás.

Exemplo 04: Método de interpolação de pandas de coluna única

Também podemos aplicar o método interpolado em uma única coluna conforme desejado. Para a criação de dados, usamos as variáveis ​​"n", "m", "o" e "p" com os valores atribuídos. A coluna "n" é selecionada do "df" para exibir com o método interpolate ().

A saída aqui exibe a interpolação de pandas de coluna única.

Exemplo 05: Método de interpolação do eixo pandas

Às vezes, de acordo com a necessidade, queremos interpolar por coluna e às vezes por linhas, para que o atributo "eixo" funcione no seu melhor. Esta função é definida padrão como a coluna um, enquanto que queremos que as linhas interpolem, temos que seguir explicitamente o eixo como 1. O "L", "F", "I" e "T" são variáveis ​​atribuídas neste "df" com seus valores correspondentemente.

A saída do eixo interpolate ():

Exemplo 06: Método de interpolação de pandas polinomiais

Em matemática, um polinômio é uma expressão que consiste em indeterminados, que também são chamados de variáveis ​​e coeficientes que executam as operações aritméticas. Na interpolação, há algumas chances de erros que podem ocorrer aqui e ali às vezes. Embora a interpolação polinomial seja a melhor prática que é feita sobre os dados da série. Os dados obtidos aqui estão em série: "4", "5", "6", "NP. nan "," 8 "e" 9 "acompanham o método interpolado do polinomial. NP.A NAN é definida como NP da Biblioteca Panda e "Nan" é declarada como "não é um número".

O resultado exibe o método Polinomial Pandas Interpolate:

Exemplo 07: Pandas Interpolation com estofamento

A interpolação do panda com o preenchimento é definida como “escrever ou copiar um valor, respectivamente, antes de um ponto ausente”. Neste método, a especificação do limite deve ser abordada. O limite deve ser o número máximo de "nans", pois preencherá isso continuamente. Este método funciona apenas na direção direta e também nos dados da série. O "df" para este método está na série como "2", "3", "np. Nan "," 5 "," 6 "," 7 "e" 8 "segue o método 'Pad' para preenchimento.

Os resultados da saída mostram a interpolação de pandas através de "preenchimento".

Conclusão

O método interpolado de pandas é um método muito conveniente para preencher o "nan" ou os valores que estão faltando. Neste artigo, aprendemos vários tipos de interpolação no quadro de dados do pandas- seja para frente, para trás ou ambos, com eixo, polinomial e por fim, o método de preenchimento. Todos eles são usados ​​para um propósito específico e a facilidade dos usuários que trabalham em enormes quantidades de dados.