“O“ Pandas ”é uma ótima linguagem para executar a análise de dados devido ao seu grande ecossistema de pacotes Python centrados em dados. Isso facilita a análise e a importação de ambos os fatores. O desvio padrão é um desvio "típico" derivado da média. É muito usado, pois retorna as unidades originais de medida do quadro de dados. Os pandas usaram std () para o cálculo do desvio padrão. O desvio padrão pode ser calculado a partir dos valores fornecidos que podem estar no quadro de dados na forma de uma linha ou coluna. Estaremos implementando todas as maneiras possíveis pelas quais o desvio padrão dos pandas é usado. Para a implementação do código, usaremos a ferramenta "Spyder", como ela é escrita em um ambiente favorável ao Python.”
Sintaxe
“DF.std () ”
A sintaxe a seguir é usada para calcular o desvio padrão no quadro de dados. O "df" no quadro de dados é a abreviação do "DataFrame". O que o desvio padrão faz? Ele mede o quão estendido os dados necessários são. Quanto mais altos valores expandidos, maior o desvio padrão deve ocorrer.
Retornar
O desvio padrão de pandas retorna o quadro de dados se o nível for especificado com base no requisito.
Observe que a função "std ()" ignorará automaticamente os valores "nan" no "df" enquanto calcula o desvio padrão de pandas. "Nan" pode ser explicado como "não um número", o que significa que não há valor atribuído a um determinado.
A seguir, estão os métodos que serão executados com exemplos do desvio padrão de pandas:
Criando o quadro de dados para o cálculo do desvio padrão em pandas
Primeiro, abra o software "Spyder". Agora importe a biblioteca de pandas como PD. Criaremos um quadro de dados que consiste em um placar com termos como "x", "y" e "z" com seus pontos como "22", "10", "11", "16", "12", "45" "," 36 "e" 40 ". Temos seus valores de ajuda como "8", "9", "13", "7", "22", "24", "4" e "6" também, tendo o valor dos rebotes como "17", " 14 "," 3 ", 5", "9", "8", "7" e "4".
Os monitores mostram o DataFrame criado de acordo com os valores atribuídos no código:
Exemplo # 01: Cálculo de desvio padrão de pandas em uma única coluna
Neste exemplo, calcularemos o desvio padrão de uma única coluna no quadro de dados de pandas. O DataFrame tem os valores da equipe como "U", "V" e "B" com seus pontos como "44", "33", "22", "44", "45", "88", "96" "E" 78 ". Os valores de assistência são como "7",, 8 "," 9 "," 10 "," 11 "," 14 "," 18 "e" 17 "também tendo os valores de rebotes como" 11 "," 9 "," 8 "," 7 "," 6 "," 5 "," 4 "e" 3 ". A coluna "Pontos" é selecionada do DataFrame para calcular o desvio padrão da coluna única.
A saída mostra o desvio padrão calculado da coluna "Pontos":
Exemplo # 02: Cálculo de desvio padrão de pandas em várias colunas
Neste exemplo, executaremos os cálculos de desvio padrão de pandas em várias colunas. Neste dataframe, os dados são novamente do placar esportivo com os valores da equipe como "n", "w" e "t" com a pontuação como "33", "22", "66", "55", "44", "88", "99" e "77". As assistências como "9", "7", "8", "11", "16", "14", "12" e "13" e Reconds como "5", "8", "1", " 2 "," 3 "," 4 "," 6 "e" 7 ". Aqui, calcularemos o desvio padrão das duas colunas "pontos" e "rebotes" usando a função std () aplicada ao quadro de dados.
Como vemos, a saída mostra que o desvio padrão surgiu como 26.944387 na coluna de pontos e 2.449490 na coluna de rebote, respectivamente.
Exemplo # 03: Cálculo de desvio padrão de pandas de todas as colunas numéricas
Agora aprendemos como calcular o desvio padrão de linhas únicas e múltiplas. E se não quisermos especificar todos os nomes de colunas no quadro de dados e calcular todo o quadro de dados? Isso é possível com apenas uma simples implementação de função do desvio padrão do Pandas para o cálculo do quadro de dados completo nos resultados. O DataFrame aqui consiste em "L", "M" e "O" com os valores de pontuação "33", "36", "79", "78", "58", "55" e duas equipes obtêm a mesma Isso é "25". As assistências são como “1”, “2”, “3”, “4”, “6”, “9”, “5” e “7” e seus rebotes como “14”, “10”, “2” , "5", "8", "3", "6" e "9". Podemos calcular todos os desvios de coluna padrão por pandas no quadro de dados usando a função Pandas "std ()".
A tela possui o desvio padrão calculado de todo o "df" mostrado abaixo; Também podemos notar que os pandas não calcularam o desvio padrão da primeira coluna, que é "equipe", porque não é uma coluna numérica.
Exemplo # 04: Desvio padrão dos pandas usando o eixo = 0
Neste exemplo, os dados de dados têm as equipes dos esportes como "G", "H" e "K" com mais dados. Aqui, calcularemos o desvio padrão usando o eixo como "0", um parâmetro usado no desvio padrão de pandas. Este argumento calcula a coluna de desvio padrão do quadro de dados.
A saída a seguir exibe os resultados em colunas do desvio padrão calculado. A coluna de pontos tem o desvio padrão calculado como “24.0313062 ”, a coluna de assistência tem o desvio padrão calculado como“ 2.669270 ”e o desvio padrão calculado da coluna de rebote é mostrado como“ 3.943802 ”.
Exemplo # 05: desvio padrão de pandas usando o eixo = 1
Aqui usaremos o parâmetro do eixo atribuído como "1" para calcular o desvio padrão em pandas. Que diferença pode o eixo “1” fazer? O argumento do eixo "1" calcula o desvio padrão em linha dos valores numéricos no quadro de dados. O DataFrame tem as três equipes como "S", "D" e "E", com a adição de colunas de dados criadas como pontos da equipe, assistências da equipe e rebotes da equipe. As direções são atribuídas com valores diferentes no quadro de dados. Este parâmetro de eixo é um divisor de águas como, quando precisamos trabalhar com os dados onde queremos que este seja em um ponto de coluna mais calculado de desvio padrão executado.
A saída a seguir exibe o desvio padrão calculado em uma linha do DataFrame:
Conclusão
O desvio padrão dos pandas é uma função muito técnica, que é uma função muito benéfica, pois encontra o desvio padrão do pacto de entusiasmo dos quadros de dados de pandas. Neste editorial, estudamos os métodos de calcular o desvio padrão em pandas. Fizemos cálculos de desvio padrão e várias colunas e também calculamos o desvio padrão de todo o quadro de dados juntos. Todas as estratégias funcionam bem desde que sejam usadas de forma consistente e com os resultados desejados.