엘라스틱서치 실무 가이드 : https://book.naver.com/bookdb/book_detail.nhn?bid=14733062
필드 데이터 타입
keyword : 키워드로 사용할 데이터.
- 분석기를 거치지 않고 색인된다.
- 용도 : 검색시 필터링, 정렬, 집계
text : 문장(or 단어)를 토큰화 하여 색인
전체텍스트를 토큰화하여 색인한다.
정렬, 집계가 필요한경우 keyword타입도 동시에 갖도록 설정한다.
Nori 한글형태소 분석기
설치방법
# 설치(bin/elasticsearch-plugin) elasticsearch-plugin install analysis-nori install analysis-nori # 설치 후 elasticsearch 재시작.
토크나이저로 복합명사 처리(decompound_mode)
- none: 복합명사로 분리하지않음
- 삼성전자 => 삼성전자
- discard: 복합명사로 분리 후 원본데이터 삭제
- 삼성전자 => 삼성, 전자
- mixed
- 삼성전자 => 삼성, 전자, 삼성전자
- none: 복합명사로 분리하지않음
복합명사 추가등록(user_dictionary)
- 설치경로/config/파일정의. ex) config/userdict_ko.txt
삼성전자 삼성전자 삼성 전자
- 설치경로/config/파일정의. ex) config/userdict_ko.txt
array
numeric
date
range
boolean
geo_point : 위치, 경도
ip
object : 계층구조 저장
nested : object데이터와 and조인을 위해 사용
completion : 자동완성
'Dev-Ops > ElasticSeach' 카테고리의 다른 글
엘라스틱서치 데이터검색 정리 (0) | 2020.04.30 |
---|