Variação de pandas

Variação de pandas
“O“ Pandas ”é uma biblioteca de software que está escrita na linguagem Python para executar a análise e manipulação de dados. E se quisermos saber o grau de spread em seu quadro de dados? A variação é usada para realizar esta tarefa. É usado para representar uma medição entre os números nos dados do spread. Os pandas criaram a função da variação, que dirá o grau do conjunto dos dados. A função para a variação do panda é "var ()". Quanto mais dados são espalhados, mais a variação é em relação à média. Mais tarde, estaremos realizando toda a maneira como a variação dos pandas pode ser usada. Para a implementação do código no exemplo, usaremos o software "Spyder", um software Python Language Friendly.”

Sintaxe

# “Df.var () ”

A sintaxe acima é empregada para calcular a variação no quadro de dados. O "df" na sintaxe representa o "DataFrame".

Estaremos executando o seguinte método para o exemplo de explicação da função da variação dos pandas:

  • Cálculo de variação de pandas para uma única coluna no DataFrame.
  • Cálculo de variação de pandas de uma única coluna no quadro de dados alterando o argumento.
  • Cálculo de variação de pandas para várias colunas no quadro de dados.
  • Variação de pandas para o cálculo de todas as colunas de dados de dados.

Criando o quadro de dados para o exemplo de implementação da variação de pandas

Abra a ferramenta “Spyder” em seu desktop/laptop. Agora, primeiro, importe a biblioteca de pandas como "PD" enquanto estamos correndo no ambiente do Panda. Vamos criar um quadro de dados; O "DF" consiste nos nomes "Tom", "Eddie", "Sam", "Leo" e "Nick" com as idades como "25", "44", "66", "55" e "78 ”. Temos os dados ausentes das idades como “20”, “30”, “40”, “50” e o “valor ausente” também temos sua renda no quadro de dados como “78000”, “70000”, “66000” , "33000" e "68000". E então, imprimiremos a condição "DF" que será usada para construir o DataFarame.

O DataFrame é criado como vemos o visor mostrando as colunas e o valor que atribuímos no código. Podemos ver que há uma "nan" escrita na coluna de dados ausentes na última, o que significa que "não é um número" e não há valor atribuído lá.

Exemplo # 01: Cálculo de variação de pandas para uma única coluna no DataFrame

Nesse caso, determinaremos a variação de uma única coluna do DataFrame. O "DF" consiste nas quatro colunas "nome", "idade", "dados ausentes" e "renda". Os nomes são "Will", "Tina", "Lily", "Sea" e "Swany" suas idades são "33", "45", "35", "85" e "78". Os dados ausentes com as idades têm os valores como "30", "40", "60", "80" e o termo ausente como "nenhum". e "68000". Como calcularemos uma variação de coluna única, precisamos especificar um nome de coluna com a variação, por exemplo, "renda_varience"; Aqui, a coluna "renda" é selecionada para o cálculo da variação. A função var () com o "df" e a coluna de renda especificada.

A saída exibe a variação calculada da coluna “Renda” usando a função Pandas Var ().

Exemplo # 02: Cálculo de variação de pandas de coluna única no quadro de dados usando DDOF

Aqui estaremos usando o argumento DDOF para o cálculo da variância em uma única coluna. No DataFrame, o DataFrame consiste nos nomes "Shein", "Rose", "Allen", "Wilson" e "Dom" as idades como "44", "23", "55", "36" e "41". A renda como "39000", "8400", "57000", "54000" e "55000" e com a coluna de dados de idades ausentes como "20", "22", "23", "25" e "Nenhuma ”. A pergunta começa com o uso do argumento mudando para "0". A resposta é que o padrão dos pandas é configurado como N-1 como o "denominador" e, se quisermos usar o "n" como denominador, então temos que usar o argumento "DDOF" e alterar seu valor para " 0 "em vez de" 1 ".

O "of" é a abreviação do "Delta grau de liberdade" que funciona como o divisor usado no cálculo como "n", onde representa o número de elementos. Aqui também, a coluna pode ser escolhida por sua escolha como pelo trabalho necessário, podemos calcular a variação de qualquer uma das colunas que consistem em valores numéricos. A coluna “Renda” também é selecionada aqui para calcular a variação.

A tela mostra a variação calculada da receita da coluna como "212560000" usando o argumento DDOF definido como "0":

Exemplo # 03: Variação de pandas para o cálculo das múltiplas colunas no quadro de dados

No primeiro exemplo, fizemos o exemplo de como calcular a variação em pandas da coluna única no quadro de dados. Agora, calcularemos a variação em várias colunas usando a função pandas var (). O DataFrame consiste em nomes como "Nina", "Ruby", "Ali", "Peter" e "Lisa", com as idades "55", "85", "45", "31" e "51". Os dados de valor ausente das idades têm os valores como "21", "32", "20", "36" e o termo que falta. Temos a renda desses indivíduos como "70000", "47000", "62000", "45000" e "56000".

Escolhemos as colunas “idades” e a “renda” da coluna para o cálculo da variação em pandas. Podemos decidir as colunas e inseri -las para calcular a variação de acordo com o desempenho adicional da análise.

A produção consiste na variação calculada da coluna “idades” e “renda” como escolhido, respectivamente. Podemos ver que a variação de diferentes colunas é mostrada separadamente com seus nomes de colunas.

Exemplo # 04: Variação de pandas para o cálculo de todas as colunas de dados de dados

Neste exemplo, implementaremos a função Pandas Var () para o cálculo da variância em todo o DataFrame. Os dados aqui contêm os nomes "Fiona", "Zayn", "Steeve", "Henry" e "Olive" suas idades são "18", "25", "35", "36" e "56". A coluna ausente de idade tem os valores "14", "12", "30", "16" e "Nenhum". Sua renda é "80000", "38000", "33000", "95000" e "78000".

A sintaxe básica é usada para todas as colunas do cálculo da variação do quadro de dados; O DataFrame selecionou toda a coluna com a função "var ()". A declaração de variação impressa imprimirá todas as variações calculadas.

A saída exibe os cálculos de variação das colunas do quadro de dados, que estavam em valores numéricos. Como "idades", "idades ausentes" e a coluna "renda". A coluna do nome tem os caracteres, portanto sua variação não pode ser calculada.

Conclusão

A variação de pandas é uma função muito útil e muito técnica. Ajuda a calcular a variação com muita facilidade usando a função var () de pandas. Neste artigo, aprendemos todos os métodos com Exemplo de execução de cada um para uma melhor compreensão. Fizemos o cálculo de variância de uma coluna única nos pandas, cálculos de variação de várias colunas em pandas, aquele com alteração do argumento da configuração padrão e também o aplicativo de cálculo de variância no quadro de dados completo. Cada um deles é muito útil por si só, dependendo do uso e da condição pela necessidade do tempo.