[Elasticsearch] Elasticsearch Hadoop Plugin 2.0 GA 테스트.
Elastic/Elasticsearch 2014. 5. 29. 12:42http://www.elasticsearch.org/blog/es-hadoop-2-0-g/
hadoop plugin 2.0 정식 버전이 나왔습니다.
1.3.0 까지 테스트는 했었는데, 2.0 은 어제, 오늘 테스트를 끝냈내요.
일단 2.0 에서는 json 지원이 되어서 편하내요.
MR 로 indexer, searcher 를 만들어서 돌려봤는데 indexer 의 경우 hadoop 에 저장되어 있는 데이터를 es 로 색인 할 수 있어서 데이터 분석에 활용 하면 아주 좋을 것 같습니다.
그리고 searcher 의 경우 EsInputFormat.class 에서 보면 내부적으로 scroll query 를 사용하기 때문에 뭘로 활용할지 아직 고민이기는 합니다.
더군다나 이게 hadoop 데이터를 검색 하거나 읽는 기능이 아니고 그냥 mr 로 es 로 검색 질의 하는 거라서 더욱 활용 범위가 애매 하내요.
샘플 코드들은 아래 링크에 있습니다.
https://github.com/elasticsearch/elasticsearch-hadoop