A computação estatística e matemática no Python tornou -se muito fácil e simples devido à biblioteca cipy. Ele nos fornece tantas funções úteis a serem usadas para computação matemática e estatística. Qualquer função pode ser executada automaticamente com as funções e métodos fornecidos na biblioteca scipy, a partir da computação de somas simples a desvios padrão complicados. Projetamos este artigo para explicar como obter a similaridade de cosseno em um programa Python. Nosso objetivo é explicar a função cosseno da biblioteca scipy neste guia.
O que é similaridade de cosseno?
Em geral, a similaridade de cosseno é a medida da semelhança entre dois conjuntos de dados. Da mesma forma, a similaridade de cosseno na análise de dados é a medida de similaridade entre duas sequências de dados dadas. Aqui, a sequência de dados é considerada um vetor. Para calcular a similaridade do cosseno, temos a seguinte fórmula:
Agora, vamos aprender a calcular a similaridade de cosseno entre dois vetores usando esta fórmula em um programa Python. Vamos explicar como usar a mesma fórmula em um programa python com a ajuda de um exemplo. Em seguida, avançaremos para usar a função cosseno que executa automaticamente todos os cálculos da fórmula no back -end.
Exemplo 1:
Primeiro, precisamos entender como a similaridade do cosseno é calculada para que saibamos exatamente como a função cosseno da biblioteca scipy funciona. Considere o seguinte exemplo de exemplo para entender como calcular a fórmula de similaridade de cosseno em um programa Python. Veja o seguinte código de amostra:
importar numpy como np
de Numpy.Linalg Norma de importação
vetor1 = np.Array ([2, 1, 2, 1, 2, 1])
vetor2 = np.Array ([4, 5, 3, 2, 6, 7])
pro = np.DOT (Vector1, Vector2)
Normal = (norma (vetor1)*norma (vetor2))
cosim = pro/normal
Print ("Cosine similaridade:", Cosim)
Primeiro, precisamos importar todas as bibliotecas necessárias para usar as funções associadas a eles. Então, a biblioteca Numpy é importada como NP no programa. O Numpy.O pacote Linalg também é importado para usar a função norma. As duas matrizes são declaradas para encontrar a similaridade de cosseno entre eles. O produto de ambas as matrizes é tirado usando a função DOT (). Para encontrar a norma da matriz criada, a função norma () é colocada para funcionar.
Compiar a raiz quadrada da soma dos quadrados dos dados fornecidos produz a norma. O produto das normas de ambas as matrizes são tomadas. Então, o produto da matriz é dividido por ele. Como sabemos que a fórmula para encontrar a similaridade de cosseno é cos (x, y) = (x * y) / (|| x || * || y ||), o mesmo é calculado com as funções internas do Python. Agora, vamos ver a similaridade computada de cosseno na seguinte ilustração:
Agora que entendemos como calcular manualmente a similaridade de cosseno pelas funções de fórmula e python, vamos aprender e entender como calcular a similaridade de cosseno automaticamente usando a função de cosseno integrado da biblioteca scipy. Veja a seguinte sintaxe da função cosseno:
A função cosseno leva duas matrizes de entrada que usam para encontrar a similaridade do cosseno e uma matriz opcional de pesos nos quais pesos cada valor nas 2 matrizes de entrada. A matriz de peso é opcional e seu valor padrão é nenhum. Isso resulta em dar 1 peso a cada valor nas matrizes de entrada. A função cosseno retorna a similaridade de cosseno entre as duas matrizes de entrada ou vetores de entrada. Agora, vamos entender tudo isso com a ajuda de exemplos.
Exemplo 2:
Neste exemplo, usaremos a função cosseno da biblioteca scipy para calcular a similaridade de cosseno entre dados automaticamente. Vamos ver como usar a função em um programa Python. Considere o seguinte código de amostra:
importar numpy como np
de Scipy.Distância de importação espacial
vetor1 = np.Array ([2, 1, 2, 1, 2, 1])
vetor2 = np.Array ([4, 5, 3, 2, 6, 7])
cosim = distância.Cosine (Vector1, Vector2)
Print ("Cosine similaridade:", Cosim)
Duas bibliotecas são importadas para o programa, Numpy e Scipy. A variável NP representa a biblioteca Numpy ao longo do programa e a biblioteca scipy é importada para chamar o pacote espacial e seu método de distância para o programa enquanto usamos a função cosseno em nosso programa. A classe de distância fornece a função cosseno, por isso precisamos chamar a função cosseno da classe de distância. Os mesmos dados de entrada que no primeiro exemplo são usados. Ambas as matrizes são passadas para a função cosseno e são mostradas na tela usando o comando de impressão. Agora, vamos ver a seguinte saída:
Exemplo 3:
Agora, vamos fornecer alguns dados complexos para a função de cosseno. Como vimos, a função cosseno calcula perfeitamente a similaridade de cosseno rapidamente. Vamos testar a função com dados grandes e complexos. Primeiro, usamos apenas uma matriz normal. Vamos fornecer as matrizes multidimensionais neste exemplo para que possamos entender melhor o funcionamento da função cosseno. Considere o seguinte código de amostra:
importar numpy como np
de Scipy.Distância de importação espacial
vetor1 = np.Array ([[2, 1, 2], [1, 2, 1], [3, 3, 3]])
vetor2 = np.Array ([[4, 5, 3], [2, 6, 7], [9, 7, 8]])
cosim = distância.Cosine (Vector1, Vector2)
Print ("Cosine similaridade:", Cosim)
Aqui, você pode ver que fornecemos as matrizes multidimensionais e passamos essas matrizes para a função cosseno. Agora, vamos ver qual resultado a função cosseno produz. Veja o seguinte resultado:
Como você pode ver, o compilador aumentou o valor do valor que indica que os dados de entrada devem ser 1-d. Como demos os dados da matriz multidimensional, a função cosseno rejeitou os dados de entrada, pois não calcula a similaridade de cosseno em matrizes multidimensionais. É preciso apenas uma matriz de entrada unidimensional. Portanto, para evitar a exceção do ValueError, precisamos garantir que os dados de entrada sejam em forma 1-D.
Conclusão
Tivemos uma rápida visão geral da função de similaridade cênica cênica. Primeiro, aprendemos o que é a semelhança cosseno e entendemos a fórmula para calcular a similaridade de cosseno, demonstrando um exemplo. Depois disso, aprendemos o que é a similaridade do cosseno scipy e exploramos alguns exemplos para aprender como o cosseno funciona da biblioteca ccepy calcula automaticamente a similaridade do cosseno entre os dados fornecidos. Também aprendemos que a função cosseno só leva dados 1-D como entrada. No caso de matrizes multidimensionais, ele lança uma exceção do ValueError.