Numpy Corcoef

Numpy Corcoef

“O pacote Numpy da Python oferece uma função chamada“ Corcoef ”; Esta função é usada sempre que precisamos calcular os coeficientes de correlação para o “Pearson Product-Moment”. Os coeficientes de correlação que calculamos para a Pearson Moment-Moment falam sobre a extensão da correlação entre as duas variáveis. Esses coeficientes de correlação são frequentemente calculados quando os dois gráficos são plotados no enredo disperso, e esperamos que a relação entre essas variáveis ​​seja mais inclinada para a relação linear; portanto, usando o coeficiente de correlação, estimamos a afiliação linear entre as variáveis ​​e Esses coeficientes de correlação são representados como "r".

Sabe-se que o Numpy é a biblioteca mais reconhecível da Python, e todas as operações (matemáticas e algébricas) podem ser aplicadas no ND-TRAYS, usando as funções que este pacote de biblioteca oferece oferece.”

Procedimento

Este artigo mostrará o método para estimar a correlação entre as duas variáveis ​​usando a função Numpy Corrcoef (). Aprenderemos o método para escrever o programa no script python para esta função, praticamente executando o programa no compilador Python para diferentes exemplos.

Sintaxe

As funções levarão as variáveis ​​ou as matrizes, e as correlações entre essas matrizes serão calculadas pela função e serão devolvidas como saída da função.

Numpy. corrcoef (x, y = nenhum, rowvar = true, viés =, ddof =, dtype)


Os "x" e "y" são os matrizes que precisamos especificar para calcular os coeficientes de correlação da variável. "Linha var" é um parâmetro opcional; Se seu valor for definido como true, que também é seu valor padrão, a função considera que cada linha é uma variável de outra forma para o caso de false, cada coluna representa uma variável. "Dtype" é o tipo de dados que o padrão é o "flutuação" para a saída e o restante dois parâmetros "viés" e "ddof" são opcionais ou não são considerados, por isso não nos preocupamos em usá -los.

Valor de retorno

O valor de retorno para o método Numpy Corrcoef () será os coeficientes de correlação que revelarão a correlação entre as variáveis.

Exemplo # 01

Quando trabalhamos em estatísticas e ciência de dados, sabemos que esses dois campos estão mais preocupados em conhecer o relacionamento entre as variáveis ​​no conjunto de dados. Cada ponto de dados em um conjunto de dados é a observação, e as propriedades de cada observação são representadas como um recurso, e esses recursos são as variáveis ​​do conjunto de dados. E qualquer conjunto de dados que usamos lida com o recurso ou as variáveis ​​e observações.

Para entender a correlação entre os recursos, pense em um exemplo de “como a precisão em atirar no basquete para o alvo do jogador é afetada pela altura do jogador”. Agora aprendemos qual é exatamente o recurso e o quanto é importante saber sobre a correlação deles. Então, com isso, vamos explorar esta função corcoef () implementando-a no nd-peças para encontrar a correlação entre os recursos das matrizes. O software que usaremos para implementar o exemplo é "Spyder", que instalou pacotes de bibliotecas nele.

Começaremos a escrever o programa e importaremos o módulo Numpy da biblioteca Numpy; Isso é obrigatório para trabalhar com os ND-Arrays. Avançaremos para a próxima etapa e criaremos duas matrizes (unidimensionais) chamando o "np. Método Array () ”e nomeará as matrizes“ ARR_1 ”e“ ARR_2 ”, respectivamente. Podemos inicializar as matrizes com elementos aleatórios; portanto, para o exemplo, especificaremos -os como "[3, 6, 9]" para ARR_1 e "[4, 7, 8]" para ARR_2. Agora queremos saber sobre a correlação entre essas duas matrizes, então encaminharemos essas matrizes para o argumento de entrada da função “NP. corcoef (arr_1, arr_2) ”e depois exibir os resultados desta função. O código deste exemplo é reescrito na linguagem de programação “Python” da seguinte maneira:



A função retornou uma mancha 2D dos coeficientes de correlação com o tipo de dados padrão "Float". Com esses coeficientes de correlação, agora podemos estimar a linearidade na relação entre duas ou mais de duas variáveis. Para este exemplo, se observarmos a matriz 2D, os valores diagonais superiores são "1", isso ocorre porque esses valores são a correlação entre o ARR_1 e o ARR_1 e o ARR_2 com o ARR_2, enquanto os valores inferior esquerdo e superior direito são os Correlação entre o ARR_1 e ARR_2 e eles são iguais e têm o valor “0.96 ”, e isso representa os coeficientes de correlação de produto-momento Pearson.

Exemplo # 02

Este exemplo levará o corcoef () para as matrizes bidimensionais, e definiremos essas duas matrizes pelo método “NP. variedade ()". Os elementos para ambas as matrizes serão “([3, 6, 9], [4, 7, 8]” e “([6, 3, 8], [2, 5, 12]), respectivamente. Vamos citar esses dois maiores de 2D "ARR_1" e "ARR_2", e depois passaremos essas matrizes para o método Numpy Corrcoef () e salvaremos os resultados desta função e os exibiremos usando o método Print (). O código para este exemplo é mostrado na figura anexada abaixo. Vamos copiar esse código e fazê -lo ser executado no compilador "Spyder".



A saída exibiu a matriz quadridimensional com os coeficientes de correlação como seus elementos com o Float do tipo de dados. Esses coeficientes representam a relação entre as matrizes bidimensionais que declaramos no exemplo. A partir do artigo, observe que a diagonal superior tem o mesmo valor de 1, que mostra que eles são os coeficientes de correlação para as mesmas variáveis, e os valores em outros lugares estão variando; Isso ocorre porque esses valores mostram a correlação entre as diferentes variáveis.

Conclusão

Este guia abrange a função de coeficiente de correlação para o “Moment do Produto Pearson”. Demonstramos no artigo como podemos aplicar essa função nas matrizes unidimensionais e multidimensionais e de que forma a função retornará a saída para os ND-ARRAYS. Analisamos ainda os resultados da função para os dois exemplos diferentes.