전통적인 정보검색을 평가하는데 이용되는 지표로 정확률과 재현율이 있다.

이 방법을 이용해서 추천엔진이 추천해준 알고리즘을 평가하는데에도 이용할수 있다.

 

간단하게 생각하면

- 정확률은 검색(또는 추천)된 정보가 얼마나 적합한가의 정도(부적합한 정보를 검색해내지 않는 능력) -> 정확성

- 재현율은 적합한 정보가 얼마나 많이 검색되었는지에 대한 여부. -> 완전성 

 

즉. 정보검색을 할때에 이용자에 따라서 요구사항이 다른데 크게 생각할때에 결과가 적더라도 불필요한 자료없이 정확한 자료를 더 원할때에는 정확률이 높은 검색이 좋고 특정 주제에 맞는 더 많은 자료를 원하는 경우에는 재현율이 높은 검색이 좋다.

 

1. 정확률 (Precision)

  -  (검색된 적합 정보수 / 검색된 정보의 총수) * 100

 

2. 재현율 (Recall)

 - (검색된 적합 정보수/ 적합 정보의 총수) * 100

 --> 재현율을 높이려면 기본 모든 데이타에 대한 지식이 필요하기 때문에 대용량에서는 처리가 어렵다.

 

--> 일반적으로 정확률과 재현율은 반비례관계이다. 정확률이 높은면 재현율이 좋을수가 없고 그 반대도 마찬가지이다.



출처) http://blog.naver.com/PostView.nhn?blogId=itkyung&logNo=10166131170