[Elasticsearch] arirang dictionary 에 영어+한글 복합어 분해 추가.
Elastic/Elasticsearch 2021. 7. 6. 14:59그냥 작은 운영 팁 정도 입니다.
영어+한글로 작성된 경우 둘 다 사전에 등록 되어 있지 않다고 하면 아래와 같이 등록을 하면 됩니다.
예) kr모터스
extension.dic 에 한글 "모터스" 만 등록 합니다.
모터스,100000000X
POST http://localhost:10800/_analyze
Request)
{
"tokenizer": "arirang_tokenizer",
"filter": [
"arirang_filter"
],
"text": "kr모터스"
}
Response)
{
"tokens": [
{
"token": "kr모터스",
"start_offset": 0,
"end_offset": 5,
"type": "korean",
"position": 0
},
{
"token": "kr",
"start_offset": 0,
"end_offset": 2,
"type": "word",
"position": 0
},
{
"token": "모터스",
"start_offset": 2,
"end_offset": 5,
"type": "korean",
"position": 1
}
]
}