Skip to content

Latest commit

 

History

History
22 lines (12 loc) · 644 Bytes

유사도.md

File metadata and controls

22 lines (12 loc) · 644 Bytes

유사도

자카드 유사도

  • 두 문장을 각각 단어의 집합으로 만든 뒤 두 집합을 통해 유사도를 측정하는 방식 중 하나
  • 측정하는 방법은 두 집합의 교집합을 두 집합의 합집합으로 나눠주는 것

abxxo, abxx 일 경우

img

자카드 유사도는 3/4

Jaccard similarity for bags

  • 자카드 유사도와 비슷하지만 중복되는 문자도 다르게 취급함

abxxo, abxx 일 경우

img

유사도는 4/5