solr 4

ElasticSearch vs Solr

현재 우리팀에서 사용하는 검색엔진으로 아래 두가지를 사용하고 있다. Solr(Legacy) ElasticSearch 두 가지의 차이점에 대해 간략히 정리해보려고 한다. Solr 사이즈가 큰 데이터 검색에 용이(문서 검색에 적합). ElasticSearch 사이즈가 작은 데이터에 대한 속성검색/연관검색/실시간 검색에 용이하며 상품 검색으로 많이 사용(커머스에 적합) 정리 이름 Solr ElasticSearch 개발사 Apache Software Foundation ElasticSearch 노드 컨트롤 주체 Apache Zookeeper Master Node 샤드 변경 방식 별도의 노드 분할 처리 필요(서버 재기동 필요) 자동 노드 분할(서버 재기동 불필요) 색인업데이트 방식 전체 데이터 캐시로 저장 변경 ..

솔라(Solr) 색인

색인이란? 검색엔진의 경우 색인(Indexing)이라는 작업을 하게 되는데 쉽게 말해서 검색엔진에서 데이터를 읽을 수 있도록 검색엔진에 맞춰 데이터를 저장한다고 보면 될 것 같다. 색인의 경우 여러 타입을 줄 수가 있는데 Solr의 경우 자세히 한번 살펴봐야 할 것 같다. 검색엔진에서 역색인이라는 용어가 등장을 하는데 이것은 흔히 책을 펴보면 맨 뒷장에 어떤 키워드가 몇번째 쪽에 있는지를 기록한 것 처럼 형태소 단위로 분해 된 단어를 Document ID와 매핑시켜 놓는 것을 말한다. 일단 여기서는 기본 string 타입으로만 색인을 할 예정이다. 색인 방법 여기서 진행 해 볼 방법은 data-import handler를 이용한 db 색인이다. data-import handler를 이용한 DB 색인은 대..

검색엔진/Solr 2022.02.25

솔라(Solr) Core 생성

Core 란? DB의 테이블과 같은 개념이라고 생각하면 된다. Core 생성 Core를 생성하는 방법은 2가지다. CLI 이용 Solr Admin을 이용 이 중에서 어떤 방법을 사용해도 상관 없지만 1번이 편리하므로 1번으로 진행한다. 터미널에 bin/solr create -c test 를 입력한다. 이는 test라는 이름을 가진 Core를 생성하는 명령어이다. 생성 확인 터미널에 cd server/solr 를 입력한 후 ls 명령어로 test 폴더가 정상적으로 생성이 되었는지 확인한다. Solr Admin 페이지를 새로고침 한 후 Core Selector 메뉴에 test라는 Core가 존재하는지 확인한다.

검색엔진/Solr 2022.02.25

Solr 시작

Solr란 무엇인가? Solr는 Apache Lucene을 기반으로 만들어진 검색엔진이다. 검색은 크게 데이터 수집, 데이터 색인, 데이터 검색의 프로세스를 가지는데 Lucene은 색인과 검색 API를 제공해주는 라이브러리다. Solr는 색인과 검색은 Lucene 엔진을 사용하면서 Http 요청에 대한 처리와 응답을 하는 웹 기반 검색엔진이라고 할 수 있다. Solr 기본 포트는 8983 이다 Solr 다운로드 다음 링크에 들어가서 최신버전을 다운받도록 하자 (필자의 경우 8.7.0 버전을 사용하고 있다)http://archive.apache.org/dist/lucene/solr/ Index of /dist/lucene/solr archive.apache.org 압축 해제 다운받은 파일의 압축을 해제 한..

검색엔진/Solr 2022.02.25