Scipy Chi-Square

Scipy Chi-Square
O Python é uma linguagem de programação de nível de alto desempenho bem conhecida que permite várias funções e operações técnicas, orientadas a objetos e matemáticas e operações. O Python fornece inúmeras bibliotecas para seus usuários e uma das linguagens de programação mais renomadas e de código aberto é "ccepy". A Scipy Library contém informações e aplica suas operações a diferentes métodos de aprendizado de máquina e.g., Algoritmos de aprendizado de máquina e os otimizadores que usamos em sistemas artificialmente inteligentes. Utilizamos um qui-quadrado do módulo da biblioteca scipy para fazer os vários testes para os dados categóricos.

Procedimento

No artigo, usaremos a função do qui-quadrado da biblioteca scipy e faremos vários testes para os dados. As informações sobre o uso desta função no script python também serão discutidas e aplicadas a vários exemplos neste artigo.

Sintaxe

Como realizaremos os dois testes para verificar a relação entre as variáveis ​​usando o método qui-quadrado, discutiremos as duas sintaxes diferentes para esta função.

Teste quadrado chi -> $ chisquare (f_obs, ddof = 1, f_exp = nenhum, eixo = 1)

Teste de Independência da Chi Square -> $ chi2_contingency (observado, lambda_ = nenhum correção = false)

Valor de retorno

Esta função retorna o valor p e o valor da estatística de teste do quadrado Chi em sua saída.

Exemplo # 01

Realizaremos o primeiro teste usando o quadrado Chi que discutimos na sintaxe como o teste CHI_SQUARE. Este teste nos diz sobre a relação entre as variáveis ​​categóricas. Esta função usa o módulo "estatísticas" do atributo do círculo. As estatísticas calculam o teste em que devemos assumir uma hipótese nula e o quadrado de Chi testa esta hipótese nula se os dados contêm ou não as frequências especificadas. É necessário as frequências observadas e esperadas como seus parâmetros e se essas duas frequências forem inferiores ou não pelo menos "cinco", o teste é considerado inválido.

Vamos executar o mesmo teste no exemplo, o compilador que usaremos para implementar o exemplo é "Google Collab", que serve como um compilador de código aberto. Ele executa o programa sem nenhuma parcela dos pacotes da biblioteca, pois já possui os pacotes instalados. Depois de abrir o compilador, basta criar um projeto com um nome exclusivo e depois vá para a próxima etapa, onde importaremos os pacotes da biblioteca para executar o teste de Chi Square.

O teste de Chi Square é dado no módulo Python Scipy STATS, para que imporemos as "estatísticas" do círculo para o nosso projeto. Depois de importarmos esta biblioteca, definiremos uma matriz com os elementos como as frequências pelo menos maiores ou iguais a cinco. Então, vamos definir a matriz com o nome "Array" com as frequências observadas como "[3, 4, 6, 8, 10, 2]". Depois de criar com êxito essa matriz, chamaremos a função do Square Chi com o prefixo "estatísticas" como "estatísticas. Chisquare () ”. Para o argumento de entrada desta função, passaremos a matriz, que é o F_OBS (frequência observada) o parâmetro da função do quadrado Chi.

Depois de executar o código mencionado no trecho abaixo, obteremos a saída como estatística do quadrado Chi e o valor p. Este teste do Chisquare será válido, pois definimos pelo menos cinco frequências observadas no parâmetro desta função.

De estatísticas de importação ccepy
Array = [3,4,8,10,12]
Estatísticas.Chisquare (matriz)

Exemplo # 02

A função do quadrado Chi tem outro teste para as variáveis ​​categóricas com o nome de "teste chi_square para a independência". Agora, este teste é um pouco diferente do teste do qui-quadrado que discutimos no exemplo acima, pois este teste verifica se houver algum relacionamento significativo entre as duas variáveis ​​da classe categórica. Para este teste, o Chi_Square usa a função do módulo estatísticas "Chisquare Contingity" do Python Scipy. O teste é realizado para mostrar se as variáveis ​​são independentes uma da outra ou não. Para trabalhar com esta função, vamos criar outra nova matriz. Para criar e definir essa nova matriz, teremos que importar o Numpy com o nome "NP" para que possamos chamar o "NP" no código posteriormente no lugar do Numpy.

Outro pacote importante da biblioteca que precisa ser importado para o funcionamento adequado do teste de contingência do quadrado Chi é as "estatísticas". Vamos importar o módulo de estatísticas da biblioteca scipy a partir da linguagem Python. Com a importação bem -sucedida das bibliotecas necessárias para o projeto ou o teste de independência da Square, na próxima etapa, definiremos uma matriz com o nome "obs_array". Vamos usar “np. Método Array () ”para criar essa matriz e as dimensões da matriz serão definidas como bidimensionais e os elementos que essa matriz conterão será como“ ([2, 2, 2], [8, 8, 8] ) ”. Esta matriz será usada como a observação que é o parâmetro de entrada para a função Chi_2 contingência ().

Para chamar o teste de contingência para a independência das duas variáveis ​​pertencentes às classes categóricas, usaremos as estatísticas do prefixo e chamaremos a função Chi_2ingency como “estatísticas.chi2_contingency (obs_array) “. Executaremos o seguinte código que é mostrado na figura para obter os resultados para o teste de independência da função de contingência do quadrado Chi.

importar numpy como np
De estatísticas de importação ccepy
obs_array = np.Array ([[2, 2, 2], [8, 8, 8]]))
Estatísticas.chi2_contingency (obs_array)

Esta função retorna o valor das estatísticas de teste do quadrado Chi, o valor p do teste e os valores das frequências esperadas para as observações de que passamos nos parâmetros da função. A saída da função é exibida na figura abaixo.

Conclusão

O artigo fornece informações detalhadas sobre o método Chi Square, que usa o módulo "estatísticas" da biblioteca scipy. Realizamos dois tipos de testes para os métodos de Chi Square, implementando os dois exemplos diferentes no script python e mostramos como é a saída ou os valores de retorno dessa função e o que eles significam no contexto do quadrado scipy chi ( ) Método.