자카드 지수
1. 개요
자카드 지수는 유한 표본 집합 간의 유사성을 측정하는 지표로, 교집합의 크기를 합집합의 크기로 나눈 값이다. 0과 1 사이의 값을 가지며, 컴퓨터 과학, 생태학, 유전체학 등 이진 데이터를 사용하는 다양한 분야에서 활용된다. 자카드 거리와 가중 자카드 지수, 확률 자카드 지수 등 변형된 형태가 존재하며, 이진 속성에 대한 자카드 지수는 단순 일치 계수와 유사하지만, 서로 다른 점이 있다. 타니모토 유사도 및 거리는 자카드 지수와 유사하게 사용되지만, 수학적으로 차이가 있을 수 있다.
자카드 지수
개요
| 다른 이름 | 자카드 유사도 계수 자카드 지수 교차-합집합 지수 |
|---|---|
| 유형 | 유사도 지수 |
| 분야 | 생태학 계통학 정보 검색 텍스트 마이닝 |
정의
| 수식 (집합 A와 B의 경우) | A와 B의 교집합/A와 B의 합집합 = A와 B의 교집합 / (|A| + |B| - A와 B의 교집합) |
|---|---|
| 설명 | 두 표본 집합 간의 유사성을 측정하는 데 사용됨. |
| 값의 범위 | '[0, 1]' (0은 집합이 겹치지 않음을 의미, 1은 집합이 동일함을 의미) |
활용
| 사용 예시 | 객체 탐지 이미지 분할 |
|---|---|
| 참고 자료 | 유클리드 거리 코사인 유사도 편집 거리 해밍 거리 상관계수 Dice 계수 중복 계수 |
📚 더 읽어볼만한 페이지
-
유사도 척도 -
코사인 유사도
코사인 유사도는 두 벡터 간의 코사인 값을 이용하여 유사성을 측정하는 방법으로, 벡터의 내적과 크기를 통해 계산되며 텍스트 매칭과 정보 검색 등에 활용된다. -
문자열 유사도 -
해밍 거리
해밍 거리는 길이가 같은 두 문자열에서 서로 다른 기호의 개수를 나타내는 거리 척도로, 아벨 군에서는 벡터의 해밍 무게를 영벡터와의 해밍 거리로 정의하며, 오류 검출, 수정 부호 이론, 정보 이론, 계통학 등에서 활용된다. -
지표 -
세계 언론 자유 지수
세계 언론 자유 지수는 국경 없는 기자회에서 발표하는 보고서로, 각국의 언론 자유 수준을 평가하고 순위를 매기며, 설문 조사와 데이터 결합을 통해 산출되고 정치, 법 등 5가지 범주를 기준으로 평가하여 점수가 높을수록 언론 자유도가 높다. -
지표 -
경제고통지수
경제고통지수는 실업률과 인플레이션율의 합으로 계산되어 국민들이 체감하는 경제적 어려움을 수치화한 지표이며, 직관적인 이해를 돕지만 경제의 복잡성을 완전히 반영하지 못한다는 한계가 있고, 다양한 변형된 지표들이 존재하며 여러 분야에서 활용된다.
목차