6월에 바쁘다는 핑계로 글을 하나도 못 올렸내요.
그런 의미에서 하나 올려 볼까 합니다.
오늘의 주제는 Elasticsearch에서 하나의 Index에 여러개의 Type을 생성 사용할 경우 주의할 점입니다.
Elasticsearch 와 RDB 와는 자주 비교가 됩니다.
개념을 쉽게 잡아 주기 위해서 인데요.
가볍게 다시 한번 비교해 보고 넘어 가겠습니다.
Elasticsearch |
RDB |
Index |
Database |
Type |
Table |
Mapping |
Schema |
Document |
Row |
Field |
Column |
※ 더 있지만 이 정도로 정리 하겠습니다.
이제 오늘의 주제 입니다.
Elasticsearch에서는 하나의 Index 생성 시 여러개의 Type을 생성 할 수 있습니다.
동일하게, RDB 도 하나의 Database에 여러개의 Table을 생성 할 수 있습니다.
하지만 여기서 Elasticsearch의 Type과 Database의 Table 사이에는 조금 다른 점이 있는데요.
RDB 에서 Table 간 Column은 이름이 같더라도 데이터 형이나 인덱스 유형등에 대해서 서로 독립적으로 사용이 됩니다.
하지만 Elasticsearch의 Type 간 Field는 이름이 같게 되면 데이터 형이나 인덱스 유형등도 같아야 한다는 것입니다.
이유는 내부적으로 Lucene 에서는 Type 간 같은 이름의 Field는 하나의 Field 로 사용이 되기 때문입니다.
단, Type 간 Field 이름이 다르다면 이건 문제가 되지 않습니다. (당연한 이야기 겠죠.)
예)
IndexA - Type1, Type2 가 있다고 가정하겠습니다.
Type1 에 geo 라는 field 가 있고 데이터 형이 geo_point 라고 가정 하겠습니다.
Type2 에도 geo 라는 field 가 있고 데이터 형이 string 이라고 가정을 하면 어떻게 될까요?
"mappings": {
"type1": {
"properties": {
"geo": {
"type": "geo_point"
}
}
},
"type2": {
"properties": {
"geo": {
"type": "string"
}
}
}
}
이 경우는 에러가 발생을 합니다.
같은 필드에 서로 다른 데이터 형을 선언 했기 때문인데요.
이렇게 사용 하시면 안됩니다.
정확한 사용은 서로 다른 type 에 같은 field 가 있다면 데이터 형도 동일하게 선언을 해주셔야 합니다.
"mappings": {
"type1": {
"properties": {
"geo": {
"type": "geo_point"
}
}
},
"type2": {
"properties": {
"geo": {
"type": "geo_point"
}
}
}
}
※ 데이터 형만을 가지고 설명을 드렸지만 기타 다른 옵션도 동일하게 선언하셔서 사용하시길 추천 드립니다.