Distância Cosine: v.4.3+
A semelhança de cosseno é uma medida de similaridade entre dois vetores não nulos de um espaço de produto interno que mede o cosseno do ângulo entre eles. O cosseno de 0 ° é 1, e é menor que 1 para qualquer ângulo no intervalo (0, p] radianos. É, portanto, um julgamento de orientação e não magnitude: dois vetores com a mesma orientação têm uma semelhança de cosseno de 1 , dois vetores orientados a 90 ° um em relação ao outro têm uma semelhança de 0, e dois vetores diametralmente opostos têm uma similaridade de -1, independente de sua magnitude.A similaridade cosseno é particularmente usada em espaço positivo, onde o resultado é nitidamente limitado em {\displaystyle [0,1]}.
O nome deriva do termo "direção cosine": neste caso, os vetores unitários são maximamente "similares" se forem paralelos e maximamente "dissimilares" se forem ortogonais (perpendiculares). Isso é análogo ao cosseno, que é a unidade (valor máximo) quando os segmentos subtendem um ângulo zero e zero (não correlacionado) quando os segmentos são perpendiculares.
Dados dois vetores de atributos, A e B, a semelhança de coseno, cos (Θ), é representada usando um produto escalar e magnitude como:
{\displaystyle {\text{similarity}}=\cos(\theta )={\mathbf {A} \cdot \mathbf {B} \over \|\mathbf {A} \|\|\mathbf {B} \|}={\frac {\sum \limits _{i=1}^{n}{A_{i}B_{i}}}{{\sqrt {\sum \limits _{i=1}^{n}{A_{i}^{2}}}}{\sqrt {\sum \limits _{i=1}^{n}{B_{i}^{2}}}}}},}
Onde {\displaystyle A_{i}} e {\displaystyle B_{i}} são componentes do vetor {\displaystyle A} e {\displaystyle B} respectivamente.
Referência
Wikipedia: Cosine similarity
Como citar este texto:
Rodrigues, W.C., 2024. Distância Cosine. DivEs - Diversidade de Espécies v.4.24.99.2404 (AntSoft Systems On Demand) - Guia do Usuário. Disponível em: <https://dives.antsoft.com.br>. Acesso em: 21/11/2024
Texto criado em: 02/11/2018 - Atualizado em: 02/11/2018
Versão do guia Online: 3.0.9.2401 - Atualizado em: 09/01/2024