A média ponderada é a média dos dados que identificam os números específicos que são mais importantes do que os outros números no quadro de dados. Estaremos implementando todas as maneiras possíveis pelas quais a média ponderada dos pandas pode ser calculada com a ajuda de vários exemplos.
Fórmula
(valores_column*weights_column).Sum ()/Weights_column.soma()Aqui, valores_column é a coluna numérica no quadro de dados de pandas que armazena os valores, e Weights_column é a coluna numérica que armazenará o peso de cada valor.
Método 1: Média ponderada de retorno
Vamos usar a função personalizada que calcula a média ponderada do quadro de dados de pandas. Usaremos a função SUM () para calcular a soma no seguinte computação:
SUM (dataframe_object [weight_data]*dataframe_object [value_data])/dataframe_object [weight_data].soma()Aqui, Weight_Data é a coluna no quadro de dados que mantém pesos para valores na coluna value_data.
Exemplo
Neste exemplo, temos um quadro de dados chamado 'cálculos' com 2 colunas do tipo inteiro. Agora, criaremos uma função personalizada, 'PESOLED_AVG_CALCLULINS', para calcular a média ponderada e chamar a função com essas duas colunas, passando -as como argumentos.
Importar pandasSaída
contagem de quantidadeExplicação
Então, a função personalizada é:
Ele retornará a média ponderada.
Portanto, a média ponderada do quadro de dados acima é 2.92.
Método 2: Média ponderada de retorno em grupos
Agora, usaremos a função groupby () para agrupar as linhas e retornar a média ponderada em cada grupo. O método Aplicar () é usado junto com o grupo () que leva a média ponderada e as colunas como parâmetros.
Dataframe_object.grupo ('grouping_column').Aplicar (PESOD_AVG_CALCLULING, 'Value_Data', 'Weight_Data')Aqui, as linhas foram agrupadas com base em valores no 'grouping_column'. O pesado_avg_calculation é uma função personalizada que calcula a média ponderada. O peso_data é a coluna no quadro de dados que mantém pesos para valores na coluna value_data.
Exemplo
Neste exemplo, temos um quadro de dados chamado 'cálculos' com 3 colunas. Agora, criaremos uma função personalizada, 'Pended_avg_CalCulocation', para calcular a média ponderada e chamar a função com as duas colunas, passando -as como argumentos. Agruparemos as linhas com base na coluna 'Item' e retornaremos a média ponderada em cada grupo.
Importar pandasSaída
contagem de quantidade de quantidadeExplicação
Então, a função personalizada é:
Ele retornará a média ponderada.
Existem três grupos nos cálculos DataFrame.
Método 3: Retornar a média ponderada usando Numpy
O módulo Numpy suporta a função média () na qual podemos passar os valores e pesos e obter a média ponderada do quadro de dados do pandas.
Numpy.média (dataframe_object ['value_data'], pesos = dataframe_object ['peso_data']))
Exemplo
Neste exemplo, temos um quadro de dados chamado 'cálculos' com 2 colunas. Vamos usar diretamente Numpy.média () para calcular a média ponderada.
Importar pandasSaída:
contagem de quantidadeExplicação
Aqui, a coluna de quantidade será o valor, e a contagem será os pesos.
A média ponderada é 273.77.
Conclusão
A média ponderada dos pandas é uma função valiosa e técnica. Fizemos a função personalizada da média ponderada dos pandas e a média ponderada de pandas numpy. A média é algo que precisamos calcular em quase tudo, mesmo os orçamentos de pequenas compras. Assim, ao falar sobre os milhões de dados, a função média de pandas ponderada é um tratamento para todos os usuários que trabalham nos cálculos médios de dados específicos em seus campos.