Módulo de estatísticas em Python

Módulo de estatísticas em Python
Se você está no mundo da pesquisa, as estatísticas são de suma importância! E Python oferece muitos módulos para estatísticas, mas o que falaremos hoje é chamado de módulo de estatística. É um módulo simples, não para estatísticas avançadas, mas para aqueles que precisam apenas de um cálculo simples e rápido. Neste tutorial, estaremos revisando o módulo de estatística em Python.

Módulo de estatísticas

O módulo de estatística fornece funções simples para calcular as estatísticas de um conjunto de dados. Eles afirmam que não estão competindo com Numpy, Scipy ou outros softwares, como SPSS, SAS e MATLAB. E, de fato, é um módulo muito simples. Não fornece testes paramétricos ou mesmo não paramétricos. Em vez disso, pode ser usado para fazer alguns cálculos simples (embora eu pense que até o Excel pode fazer o mesmo). Eles afirmam ainda que apoiam int, flutuação, decimais e frações.

O módulo de estatística pode medir (1) médias e medidas da localização central, (2) medidas de propagação e (3) estatísticas para relações entre duas entradas.

Estatisticas.significar()

O módulo de estatística contém um grande número de funções. Não abordaremos cada um, mas alguns deles. Nesse caso, o conjunto de dados é colocado em uma lista. A lista é então passada para a função.

Para números inteiros:

principal.estatísticas de importação PY
x = [1, 2, 3, 4, 5, 6]
média = estatística.média (x)
Imprimir (média)

Quando você corre o último, você recebe:

principal.Py 3.5

Para frações, a terminologia é um pouco diferente. Você terá que importar o módulo chamado frações. Além disso, você precisa colocar a fração entre colchetes e escrever uma capital f na frente. Assim 0.5 seria igual a f (1,2). Isso não é viável para grandes conjuntos de dados!

principal.estatísticas de importação PY
de frações, importar fração como f
x = [F (1,2), F (2,3), F (3,4), F (4,5), F (5,6), F (6,7)]
média = estatística.média (x)
Imprimir (média)

Quando você corre o último, você recebe:

principal.PY 617/840

Na maioria dos trabalhos de pesquisa, o tipo mais comum de número encontrado é o valor decimal, e isso é muito mais difícil de realizar com o módulo de estatística. Você primeiro precisa importar o módulo decimal e depois colocar todos os valores decimais na cotação (que é absurdo e impraticável se você tiver grandes conjuntos de dados).

principal.estatísticas de importação PY
de importação decimal decimal como D
x = [D ("0.5 "), D (" 0.75 "), D (" 1.75 "), D (" 2.67 "), D (" 7.77 "), D (" 3.44 ")]
média = estatística.média (x)
Imprimir (média)

Quando você corre o último, você recebe:

principal.Py 2.81333333333333333333333333333

O módulo de estatística também oferece a média fmeane, geométrica e média harmônica. Estatisticas.mediana () e estatística.mode () são semelhantes às estatísticas.significar().

Estatisticas.variância () e estatística.stdev ()

Em pesquisa, muito, muito raramente é o tamanho da amostra tão grande que é igual ou é igual a aproximadamente o tamanho da população. Então, veremos a variação da amostra e o desvio padrão da amostra. No entanto, eles também oferecem uma variação populacional e um desvio padrão da população.

Mais uma vez, se você quiser usar decimais, precisa importar o módulo decimais e, se quiser usar frações, precisará importar o módulo de frações. Isso, em termos de análise estatística, é bastante absurdo e muito impraticável.

principal.estatísticas de importação PY
de importação decimal decimal como D
x = [D ("0.5 "), D (" 0.75 "), D (" 1.75 "), D (" 2.67 "), D (" 7.77 "), D (" 3.44 ")]
var = estatística.Variação (x)
impressão (var)

Quando você corre o último, você recebe:

principal.Py 7.1442666666666666666666666667

Como alternativa, o desvio padrão pode ser calculado ao fazer:

principal.estatísticas de importação PY
de importação decimal decimal como D
x = [D ("0.5 "), D (" 0.75 "), D (" 1.75 "), D (" 2.67 "), D (" 7.77 "), D (" 3.44 ")]
std = estatística.stdev (x)
Imprimir (std)

Quando você corre o último, você recebe:

principal.Py 2.672876103875124748889421932

Correlação de Pearson

Por alguma razão, embora os autores do módulo de estatística ignorassem testes ANOVA, testes t, etc ... eles incluíram correlação e regressão linear simples. Lembre -se de que a correlação de Pearson é um tipo específico de correlação usada apenas se os dados forem normais; é, portanto, um teste paramétrico. Há outro teste chamado correlação de Spearman, que também pode ser usada se os dados não forem normais (o que tende a ser o caso).

principal.estatísticas de importação PY
x = [1.11, 2.45, 3.43, 4.56, 5.78, 6.99]
y = [1.45, 2.56, 3.78, 4.52, 5.97, 6.65]
corrig = estatística.Correlação (x, y)
Imprimir (correr)

Quando você corre o último, você recebe:

principal.py 0.9960181677345038

Regressão linear

Quando uma regressão linear simples é realizada, ela joga uma fórmula:

y = inclinação * x + interceptar

Excel faz isso também. Mas o máximo que esse módulo pode fazer é imprimir o valor da inclinação e a interceptação da qual você pode recriar a linha. O Excel e o SPSS oferecem gráficos para acompanhar a equação, mas nada disso com o módulo de estatística.

principal.estatísticas de importação PY
x = [1.11, 2.45, 3.43, 4.56, 5.78, 6.99]
y = [1.45, 2.56, 3.78, 4.52, 5.97, 6.65]
inclinação, interceptação = estatística.linear_regression (x, y)
Impressão ("A inclinação é % s" % inclinação)
impressão ("a interceptação é % s" % intercept)
print (" %s x + %s = y" %(inclinação, interceptação))

Quando você corre o último, você recebe:

principal.py a inclinação é 0.9111784209749394
A interceptação é 0.46169013364824574
0.9111784209749394 x + 0.46169013364824574 = y

Covariância

Além disso, o módulo de estatística pode medir a covariância.

principal.estatísticas de importação PY
x = [1.11, 2.45, 3.43, 4.56, 5.78, 6.99]
y = [1.45, 2.56, 3.78, 4.52, 5.97, 6.65]
COV = Estatística.covariância (x, y)
Impressão (COV)

Quando você corre o último, você recebe:

principal.Py 4.279719999999999

Embora o Python ofereça um módulo chamado módulo de estatística, não é para estatísticas avançadas! Lembre -se, se você quiser analisar seu conjunto de dados, vá com qualquer módulo que não seja o módulo de estatística! Não é apenas muito simples, mas também todos os recursos que ele oferece podem ser facilmente encontrados no Excel também. Além disso, existem apenas dois testes - a correlação de Pearson e a regressão linear simples - que este módulo oferece em termos de testes. Não há ANOVA, nem teste t, qui-quadrado ou qualquer um dos semelhantes! E além do mais, se você precisar usar decimais, precisa invocar o módulo decimal, que pode ser frustrante para conjuntos de dados grandes e muito grandes. Você não vai pegar ninguém que precise de um trabalho estatístico real feito usando este módulo (vá com SPSS se precisar de coisas avançadas), mas se for uma diversão simples que você está procurando, então este módulo é para você.

Codificação feliz!