Em Python, há um pacote para funções estatísticas na biblioteca cipy. A sub-pacote scipy é chamada de centeada.Estatísticas. É empregado principalmente para procedimentos estatísticos e distribuições probabilísticas. Os tipos de funções de probabilidade são numerosos. A natureza de código aberto da biblioteca permite a expansão de sua capacidade estatística. Podemos trabalhar com uma variedade de distribuições, incluindo distribuições binomiais, uniformes e contínuas. Temos funções para variáveis contínuas e discretas. Além disso, podemos executar o teste t e calcular o escore T. Com inúmeros exemplos, vamos aprender mais sobre as funções de estatísticas scipy.
Explicação de estatísticas ccepy
Numerosas distribuições de probabilidade, estatísticas de frequência e resumo, funções de correlação e testes estatísticos, estimativa de densidade do kernel, estatísticas mascaradas, funcionalidade quase-monte carlo e outros recursos estão incluídos neste módulo.
Existem muitas áreas no vasto campo de estatísticas que saem do escopo de Scipy e são tratadas por outros pacotes. Entre os mais significativos estão:
O círculo.O sub-pacote STATS contém todas as rotinas estatísticas, e a função de informação (estatísticas) retorna uma lista bastante abrangente dessas funções. Os pacotes de subditstring estatísticas contêm adicionalmente uma lista das variáveis aleatórias disponíveis. Este módulo inclui uma coleção considerável de distribuições de probabilidade, além de uma coleção em expansão de funções estatísticas.
O que é uma distribuição aleatória contínua normal no círculo?
Para abranger variáveis aleatórias discretas e contínuas, duas classes de distribuição geral são desenvolvidas. A distribuição aleatória contínua normal é um dos tipos que vamos discutir aqui.
A variável pode ter qualquer valor nesse tipo de distribuição de probabilidade. É por isso que é conhecido como uma variável aleatória contínua.
Exemplo 1:
O primeiro exemplo aqui mostra como os conceitos discutidos na função das seções anteriores. Nós importamos a função norma, que deriva da classe RV_CONTINUUIO, neste exemplo de código. As funções contêm abordagens e informações para abordar uma distribuição contínua específica.
Para calcular o CDF em uma matriz, utilizamos a função de norma. Vamos fazer um esforço para compreender a linha de código por linha.
Na primeira linha do código, importamos a norma do círculo.Biblioteca de estatísticas. Depois disso, a biblioteca Numpy é importada para a execução do programa. Uma variável chamada "cheque" é criada depois em que a matriz numpy criada é armazenada. Por fim, a declaração de impressão é usada na qual a norma.A função CDF () é executada na matriz especificada. Vamos executar o código e ver qual resultado ele produz.
de Scipy.Estatísticas Norma de importação
importar numpy
check = numpy.Array ([4, -2,3,2,5,0])
Imprimir (norma.CDF (check))
Aqui, você pode ver o resultado que é gerado a partir do código escrito anteriormente.
Mais uma coisa que podemos fazer é usar a função percentual para determinar a mediana da distribuição. O inverso do CDF é PPF, que é abreviado como PPF.
Aqui, você pode ver a mediana dos valores de CDF que são gerados no código anterior.
Como gerar uma distribuição uniforme no círculo
Simplificando, uma distribuição uniforme denota uma probabilidade plana e constante de que um valor caia dentro de um determinado intervalo. Criar uma distribuição uniforme é possível. Depois de importar a função uniforme, devemos criar o CDF da matriz.
As palavras -chave de escala e LOC nos permitem expandir a funcionalidade. A palavra -chave LOC define o valor médio, enquanto a palavra -chave escala define o desvio padrão. Aqui está o código:
Primeiro, importamos o módulo Numpy e uniforme. Depois disso, criamos a variável na qual armazenamos a matriz Numpy criada. Finalmente, a declaração de impressão pode ser vista em que o uniforme.A função CDF é usada.
importar numpy
de Scipy.estatísticas importantes uniformes
check_res = numpy.Array ([7,4,9,5,4])
Imprimir (uniforme.CDF (check_res, loc = 5, escala = 3))
Anexado está a saída para sua ajuda.
Como gerar uma distribuição binomial no círculo
Além disso, ao importar binom, a instância da classe discreta do trailer, podemos produzir uma distribuição binomial. É composto de informações e métodos de classe. O código é o mesmo do código anterior, exceto que usamos o Bunom.Função cdf () aqui, que inclui três parâmetros que você pode ver na última linha do código.
importar numpy
de Scipy.Estatísticas Binom de importação
saída = numpy.Array ([7,4,5,4]))
Imprimir (Binom.CDF (saída, n = 1, p = 3))
Aqui está o resultado:
O que são estatísticas descritivas?
Os resultados de estatísticas fundamentais como min, max, média e variação são retornadas usando a matriz Numpy como entrada. A tabela a seguir lista um punhado das operações estatísticas fundamentais incluídas no Scipy.pacote de estatísticas.
Nome da função | Descrição |
descrever() | As estatísticas descritivas da matriz dada são calculadas através desta opção. |
gmean () | A média geométrica do eixo especificado é calculada com esta opção. |
Hmean () | Ao longo do eixo escolhido, a média harmônica é calculada pela função Hmean (). |
Curtose () | Esta função calcula a curtose. |
modo() | Este método retorna o valor modal. |
Skew () | O método skew () testa a assimetria dos dados especificados. |
f_oneway () | Este método executa uma ANOVA de 1 vias. |
IQR () | Ele determina a faixa interquartil dos dados ao longo do eixo escolhido. |
zscore () | Calcula a pontuação z de cada valor da amostra. É relativo à média da amostra, bem como ao desvio padrão. |
SEM () | Ele determina os números no erro padrão da matriz de entrada da média. |
O que é um teste t?
O teste t é uma das melhores maneiras de avaliar se duas médias são diferentes uma da outra ou não. O teste t também é um tópico importante de discussão em termos de diferenças de grupo.
T-Score
O escore T mede a proporção de dois grupos, bem como a variação dentro dos agrupamentos. O escore T reflete como os grupos são semelhantes ou diferentes; Quanto menor a escore T, mais significativa a escore T e maior a diferença entre os grupos.
Aqui, recebemos duas amostras que podem vir da mesma distribuição ou duas distribuições diferentes. E queremos determinar se eles compartilham as mesmas características estatísticas. Veja o seguinte código que está anexado aqui:
De estatísticas de importação ccepy
rvs_res = estatísticas.norma.RVs (loc = 4, escala = 8, tamanho = (30,4))
print ("Aqui está o resultado da comparação das duas amostras:")
Imprimir (estatísticas.ttest_1samp (rvs_res, 4.0))
Anexado está a saída:
Um valor p na saída anterior representa a probabilidade de que os resultados dos dados de amostra tenham acontecido por acidente. A faixa de valores p é de 0% a 100%.
Conclusão
As funções de estatísticas cipy foram o tópico deste artigo. O módulo de estatísticas do Scipy é um componente crucial. É útil obter as distribuições probabilísticas. Usando estatísticas scipy, números aleatórios discretos ou contínuos podem ser produzidos. Também inclui outras funções adicionais que fornecem valores estatísticos descritivos. Discutimos variáveis aleatórias, contínuas e aleatórias neste post. Funções para interagir com vários tipos de distribuição são discutidas. Além disso, descrevemos como você pode analisar os dados usando o teste t para determinar o valor médio.