[Elasticsearch - The Definitive Guide] Dealing with Human Language
Elastic/TheDefinitiveGuide 2015. 12. 16. 17:47글 제목과 비슷할 수도 다를 수도 있습니다.
precision 과 recall 에 대한 설명이 짧게 잘 표현이 되어 있어서 기록해 봅니다.
원문링크)
원문 Snippet)
Full-text search is a battle between precision—returning as few irrelevant documents as possible—andrecall—returning as many relevant documents as possible.
원래 이 문서는 언어에 대한 처리 목적 이였습니다.
그래서 정의한 5가지 title 만 정리해 봤습니다.
- Normalizing Tokens
추출 된 token 에서 필요 없는 character를 제거 합니다.
- Reducing Words To Their Root Form
Word 에 붙은 불필요한 정보를 제거 합니다. (word의 origin을 만든다고 보시면 쉽습니다.)
- Stopwords
불용어 처리를 합니다. (즉, 색인 대상에서 제외 시킵니다.)
- Synonyms
동의어 또는 유의어 처리를 합니다.
- Typoes and Mispelings
오타 처리를 합니다.