logo

한국어
글 수 11
번호
제목
글쓴이
11 EJ Analyzer (Elasticsearch Jaso Analyzer) 1.0.0 1
홈지기
2016-02-10 2243
elasticsearch 자동완성용 한글자소 분석기 입니다. 다음 참고하여, 설치하시고 테스트 가능합니다. https://github.com/netcrazy/elasticsearch-jaso-analyzer  
10 루씬의 Scoring 3
홈지기
2016-02-01 1420
일부 주요내용 TF : 문서에서 해당 Term이 나온 횟수입니다. 루씬에서는 sqrt(횟수)로 구현됩니다. 하나의 문서에서 해당 용어의 출현빈도가 많을 수록 가중치가 높다. IDF : 해당 Term이 전체 Document의 Set에 얼마나 나왔는지를 측정합니다. 다수의 문서에...  
9 회귀분석 2
홈지기
2015-08-20 2678
회귀(regression)이라는 말은 유전학자 프란시스 골턴이 유전의 법칙을 연구하다 나온 명칭이다. 프란시스 골턴은 아버지의 키가 아무리 크다고 할지라도 아들의 키는 아들 세대의 평균으로 접근하는 경향이 있다는 것을 발견했다. (다행이다... 내 아들은 키...  
8 정보검색시스템에서 정확율과 재현율 5
홈지기
2015-08-20 3104
전통적인 정보검색을 평가하는데 이용되는 지표로 정확률과 재현율이 있다. 이 방법을 이용해서 추천엔진이 추천해준 알고리즘을 평가하는데에도 이용할수 있다. 간단하게 생각하면 - 정확률은 검색(또는 추천)된 정보가 얼마나 적합한가의 정도(부적합한 정보...  
7 Solr 5.x 를 톰캣에서 설치?? 768
홈지기
2015-06-24 10509
아무런 의심없이 Solr 5.2.1을 다운받고 톰캣에 셋팅할려고 하니,, 실행이 안된다.. 아무리 오류를 구글링 해도 답이 없다.. ㅠㅠ 공식문서를 참고해보니... 뭐야 더이상 지원이 안된다고 하네요.. 엉엉... No Longer Supported Icon Beginning with Solr 5.0,...  
6 SOLR filter-query vs main-query
홈지기
2015-01-28 3636
FilterQuery는 문서의 IDS를 반드시 저장합니다. 이것은 매우 빠르게 문서를 필터링 할수 있습니다. (FilterQuery는 결과를 캐시합니다.) 일반 쿼리는 동일한 기능을 수행 할 수 있지만, "관련성"을 결정하는 매우 복잡한 가중치 시스템을 갖고 있습니다. 결과...  
5 can not sort on a field which is neither indexed nor has doc values 1
홈지기
2015-01-28 3386
말그대로... 소팅필드는 indexed="true" 이어야 됨..  
4 How to increase heap size in solr or tomcat? 2
홈지기
2015-01-13 4060
Solr는 기본 Heap size 으로는 운영이 불가합니다. Solr4 교재에서는 다음과 같이 소개하고 있습니다. JVM Heap 최대 사이즈는 가용메모리의 60%를 넘지 않게 셋팅한다. 뭐 GC관련 I/O발생이 높다고 알려져있음.. JAVA_OPTS="-Xms1024m -Xmx4096m" Solr Query ...  
3 Lucene 의 Analyzers and Tokenizers 클래스 다이어그램
홈지기
2015-01-13 2761
Analyzer는 텍스트에서 색인어를 추출하고 Tokenstream을 만들수 있습니다. Analyzer는 적어도 하나 이상의 Tokenizer를 가질 수 있으며, 다수의 Filter를 가지고 있을수 있거나, 가지고 있지 않을 수 있습니다. Lucene 의 Analyzers and Tokenizers 클래스 다...  
2 elasticsearch 와 한글형태소... 4
홈지기
2014-12-04 6534
개인적으로 solr에 경험이 좀 있지만, 대세는 elasticsearch로 넘어가는듯 하다... 그냥 나이많이 개발자의 감이랄까... ㅠ solr에서는 한글형태소가 이미 arirang이 표준처럼 자리잡혔지만, elasticsearch의 한글형태소를 찾다보니 결국 base는 arirang이란것...  
1 stemming (어간추출) 9
홈지기
2014-07-16 10405
어간 추출(語幹 抽出, 영어: stemming)은 형태론 및 정보 검색 분야에서 어형이 변형된 단어로부터 접사 등을 제거하고 그 단어의 어간을 분리해 내는 것을 의미한다. 여기서 어간은 반드시 어근과 같아야 할 필요는 없으며, 어근과 차이가 있더라도 관련이 있...