Portanto, um teste do qui-quadrado é uma alternativa excepcional para nos ajudar a entender melhor, além de avaliar o vínculo entre as duas variáveis categóricas. Ambas as variáveis devem vir de uma população semelhante e ser categóricas; Essas variáveis são então classificadas como sim/não, masculino/feminino, vermelho/verde, e assim por diante.
Ao avaliar as contagens e contagens de respostas categorizadas entre vários grupos independentes, o teste do qui-quadrado é benéfico.”
Teste do qui-quadrado em r
Quando o teste é concluído, o resultado é um valor "P", que você usa para determinar se sua hipótese de independência está correta ou não. O número “P” simplesmente representa a probabilidade de que suas variáveis sejam independentes.
Se o valor "p" for superior a 0.05, a probabilidade de independência é bastante forte e adequada para determinar que os fatores não estão relacionados. Por outro lado, qualquer coisa menos que 0.05, por outro lado, denota uma chance insignificante de independência, e há um alto link entre os fatores.
Você pode estar questionando por que 0.05 e não qualquer outra quantidade. Este número foi elaborado por pesquisadores estatísticos e é amplamente adotado apenas porque 0.05 é comumente utilizado como um ponto definidor.
Para resumir o que foi dito acima:
H0: As variáveis não estão associadas uma à outra, e não há correlação entre elas.
H1: As variáveis estão associadas entre si.
R Programação nos fornece um “Chisq.teste()" função para realizar testes qui-quadrado e avaliar se existe alguma relação entre as duas variáveis dos dados fornecidos.
O teste do qui-quadrado opera em r usando a seguinte sintaxe:
# chisq.teste (v1, v2)
Este artigo ensinará como executar e entender o teste do qui-quadrado em r com os exemplos fornecidos abaixo.
Exemplo 1
Estamos iniciando a implementação do teste do qui-quadrado com o exemplo mais simples e básico.
Na primeira etapa, usamos a função "rm ()" para remover todos os objetos desnecessários, caso eles já existam. Agora, o código principal começa. Criamos duas variáveis de objeto; "X_actual" e "x_predict.”Atribuir“ x_actual ”uma lista de valores reais usando a função“ c () ”em r. Ao atribuir “x_predict”, uma lista de valores previstos. Agora chamando o “Chisq.test () ”” função e passando os valores reais e previstos como um parâmetro. Usando o objeto "chi" armazenado, os valores do teste do qui-quadrado. A declaração "print ()" simplesmente imprimirá o resultado do teste do qui-quadrado.
Antes de interpretarmos o resultado do teste do qui-quadrado, vamos apresentá-lo a algumas terminologias que serão usadas no resultado do teste do qui-quadrado.
"DF" são os valores que são livres para mudar das variáveis fornecidas.
“X-quadrado” é a variável arbitrária no teste do qui-quadrado que ilustra a média das variáveis observadas vs. Contagem de frequência prevista.
“Valor P” expressa a perspectiva da amostra.
Se o valor p for menor que o valor de significância, que é 0.05 Normalmente, podemos interpretar o teste do qui-quadrado. Nesse caso, eliminamos a hipótese nula e declaramos que existe uma relação entre as duas variáveis. Em outras palavras, uma variável pode elucidar o outro.
O valor p em nosso cenário é maior do que o valor de significância declarado (0.05). Por fim, aceitamos hipótese nula e presumimos que as variáveis são autônomas.
Exemplo # 2
Neste exemplo, usaremos um conjunto de dados embutido fornecido pela R Base e realizaremos um teste qui-quadrado nele. O conjunto de dados que vamos utilizar é “peso de brilho.”Ele nos fornece dados sobre o peso dos filhotes com base em sua dieta e no período após o nascimento.
Estamos conduzindo este teste para ver se há algum relacionamento entre a dieta dos filhotes e o peso do filhote. Função interna de R “Chisq.teste () "elegantemente fornece tudo o que você precisa saber sobre a independência de variáveis em um conjunto de dados para determinar se eles estão ou não associados.
Começaremos importando o conjunto de dados para r.
O resultado dos testes do qui-quadrado na imagem abaixo mostra que o valor "P-valor" deste teste é maior que o "valor p" significativo que é 0.05, o que indica que o peso dos filhotes é independente de sua dieta. Mesmo que isso possa parecer estranho a princípio, já que o peso de cada garota deve ser determinado pelo que a garota consome. No entanto, esse pode não ser o caso nesta ilustração.
Agora, compararemos o peso com outra variável, que é “tempo.”Essa variável calcula quanto tempo se demorou desde que a garota nasceu.
Nesse segmento de código, acabamos de substituir a coluna "Diet" pela coluna "Time", pois agora estamos comparando os filhotes de traçar o tempo com o peso deles para o teste do qui-quadrado.
No teste do qui-quadrado resultante, o valor de "P" pode ser visto, o que é muito pequeno. Isso significa que há uma forte associação entre a época em que os filhotes nasceram e o peso dos filhotes. Isso significa que eles começam a ganhar peso à medida que envelhecem.
Conclusão
Nosso artigo de hoje gira em torno do tópico do teste do qui-quadrado em R. Na seção Introdução, explicamos o teste do qui-quadrado, por que é realizado e como é realizado. Discutimos todos os meros conceitos incluídos neste tópico. Depois disso, realizamos 2 exemplos de codificação prática em RStudio no Ubuntu 20.04. Nosso primeiro exemplo o ajudará a realizar um teste qui-quadrado em variáveis definidas pelo usuário, enquanto o 2nd Exemplo é executado usando o quadro de dados interno da base R. Prevemos que esta peça de escrita o facilitará na condução do teste do qui-quadrado na programação r.