728x90
Lucene(루씬)이란?
- 오픈소스 기반의 라이브러리
- 검색 엔진의 기본 기능인 색인, 검색, 형태소 분석을 제공
Lucene기반의 대표적인 검색엔진
- ElasticSearch
- Solr
Lucene의 기본개념
- 인덱스(Index)
- 문서(Document)
- 필드(Field)
- 용어(Term)
Term < Field < Document < Index 와 같은 각 단위의 집합 구조
색인
IndexWriter가 IndexFile을 만드는 과정
- 수정이 불가능한 Immutable Type(불변형)
- 여러개로 생성 된 Segments 파일들을 Merge라는 작업을 통해 하나의 색인 파일로 만드는 과정이 필요
- 하나의 Index는 하나의 IndexerWriter로 구성
색인 파일에 대한 루씬 참고자료
검색
IndexWriter로 색인 후 IndexSearch로 검색하는 과정
- IndexSearch는 IndexReader를 통해 검색 수행을 함
- 하나의 Index에는 Segment 별로 N개의 LeafReader가 존재
형태소 분석
입력 받은 문자열에서 형태소를 분리하는 과정
'검색엔진 > ElasticSearch' 카테고리의 다른 글
Window 환경에서 Docker로 실행할 때 max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144] 이런 에러가 발생한다면? (0) | 2022.02.17 |
---|---|
Logstash 에서 여러 Elasticsearch로 요청 보내기 (0) | 2022.02.14 |
Lucene 인덱스 파일 형식 (0) | 2022.02.14 |
Elastic Stack 다운로드 (0) | 2022.02.09 |
Elasticsearch 소스 Clone하기 (0) | 2022.02.09 |