조준화의 오류정정

조준화의 오류정정

  • 분류 전체보기
    • TIL
    • 프로그래밍 언어
      • Java
      • C++\C
      • HTML\CSS
    • 알고리즘
      • 문제풀이
      • 알고리즘 지식
    • CS
      • Computer Architecture
      • Operating System
      • Computer Network
      • 백엔드
      • Information Retrieval
      • Database System
      • ServerProgramming
    • AI
      • CS231n
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

조준화의 오류정정

컨텐츠 검색

태그

백트래킹 html dfs 자료구조 문자열 문제풀이 정렬 알고리즘 우선순위 큐 자바 BFS java BOJ til 시뮬레이션 OS C++ 재귀 백준 DP

최근글

댓글

공지사항

아카이브

documents(1)

  • [Information Retrieval] Term voc and posting - Skip Pointers, Phrase queries, Proximity search

    1. Documents기본적으로 정보검색은 document의 단어를 대상으로 한다.document의 포맷은 pdf, word, excel 등이 될 수 있고 그 안의 character set 또한 다양하다. utf 등등..한글 이메일에 일본 문서가 실리는 경우 이메일 본문, 첨부된 문서를 각각 document로 볼건지, 전체를 document로 볼건지 또한 고민해야 한다. 정보검색의 설계에 달려있는 문제이다.정보검색은 다양한 문서에서 어떻게 문서를 파싱 해서 text를 정확하게 찾아내서 검색을 하느냐에 대한 얘기이다.2. Terms - General + Non-EnglishWordtext 내에 나타나는 delimiter(빈 칸, 탭 등)로 분리된 하나의 연속된 단위의 characterTermnormaliz..

    2024.10.01
이전
1
다음
티스토리 github notion
© 2018 TISTORY. All rights reserved.

티스토리툴바