[Information Retrieval] Boolean Retrieval - Term, Document, Index
1. IntroductionInformation Retrieval데이터베이스에서 처리하는 정형화된 데이터가 아닌 텍스트 같은 비정형 데이터로 이루어진 문서와 같은 물질을 찾는 것이다.문장을 파악하는 것인데, 예를 들어 홍길동은 A+를 받았다.라는 문장을 보고 홍길동 : A+라고 파악하는 것을 말한다.사용자가 찾고자 하는(information need) 비정형 데이터를 검색하는 것이다.예를 들어 사용자가 파리 지도라고 검색한다면 초파리의 염색 지도가 나올 수 있다. 그러나 사용자가 원하는 건 프랑스 파리의 지도이다.이러한 정보를 대용량 문서에서 찾아주는 것이 정보 검색이다.즉, 핵심은 정보 검색은 unstructured를 갖는 text를 documents에서 찾는 것인데, 큰 collection에서 inf..
2024.09.30