검색엔진/Solr 3

솔라(Solr) 색인

색인이란? 검색엔진의 경우 색인(Indexing)이라는 작업을 하게 되는데 쉽게 말해서 검색엔진에서 데이터를 읽을 수 있도록 검색엔진에 맞춰 데이터를 저장한다고 보면 될 것 같다. 색인의 경우 여러 타입을 줄 수가 있는데 Solr의 경우 자세히 한번 살펴봐야 할 것 같다. 검색엔진에서 역색인이라는 용어가 등장을 하는데 이것은 흔히 책을 펴보면 맨 뒷장에 어떤 키워드가 몇번째 쪽에 있는지를 기록한 것 처럼 형태소 단위로 분해 된 단어를 Document ID와 매핑시켜 놓는 것을 말한다. 일단 여기서는 기본 string 타입으로만 색인을 할 예정이다. 색인 방법 여기서 진행 해 볼 방법은 data-import handler를 이용한 db 색인이다. data-import handler를 이용한 DB 색인은 대..

검색엔진/Solr 2022.02.25

솔라(Solr) Core 생성

Core 란? DB의 테이블과 같은 개념이라고 생각하면 된다. Core 생성 Core를 생성하는 방법은 2가지다. CLI 이용 Solr Admin을 이용 이 중에서 어떤 방법을 사용해도 상관 없지만 1번이 편리하므로 1번으로 진행한다. 터미널에 bin/solr create -c test 를 입력한다. 이는 test라는 이름을 가진 Core를 생성하는 명령어이다. 생성 확인 터미널에 cd server/solr 를 입력한 후 ls 명령어로 test 폴더가 정상적으로 생성이 되었는지 확인한다. Solr Admin 페이지를 새로고침 한 후 Core Selector 메뉴에 test라는 Core가 존재하는지 확인한다.

검색엔진/Solr 2022.02.25

Solr 시작

Solr란 무엇인가? Solr는 Apache Lucene을 기반으로 만들어진 검색엔진이다. 검색은 크게 데이터 수집, 데이터 색인, 데이터 검색의 프로세스를 가지는데 Lucene은 색인과 검색 API를 제공해주는 라이브러리다. Solr는 색인과 검색은 Lucene 엔진을 사용하면서 Http 요청에 대한 처리와 응답을 하는 웹 기반 검색엔진이라고 할 수 있다. Solr 기본 포트는 8983 이다 Solr 다운로드 다음 링크에 들어가서 최신버전을 다운받도록 하자 (필자의 경우 8.7.0 버전을 사용하고 있다)http://archive.apache.org/dist/lucene/solr/ Index of /dist/lucene/solr archive.apache.org 압축 해제 다운받은 파일의 압축을 해제 한..

검색엔진/Solr 2022.02.25