[Algorithm] TF (Term Frequency)
Elastic/Elasticsearch 2013. 5. 15. 14:12참고 URL : http://kaistwebst.blog.me/130165776517
위 문서에 있는 것 처럼 하나의 문서에서 출현한 하나의 단어 출현 빈도수 입니다.
수식으로 표현 하면
Di : 문서
Wj : 단어(Term)
fij : 출현 단어 빈도 수
log2(1+fij)
예)
Di : "안녕하세요 검색 관련 색인 빈도 중 Term 빈도, Document 빈도"
Wj : "빈도"
fij : 2
log2(1+2)
DF 설명 : 색인어당 문서의 빈도 수 (색인어 A 가 들어 있는 문서 들 이라고 보면 됨)