• SharePoint Search 테스트 시나리오
  1. 아래 그림과 같이 인코딩 형식을 유니코드(UTF-8) 형식으로 저장한 eml 파일과

    한국어(EUC-KR) 형식으로 저장한 eml 파일이 있습니다.   

 

  1. 위 2가지 형태로 저장한 eml 파일을 Document Library에 업로드합니다.

    (Document Library 뿐만 아니라 그 외 Custom List의 Attachment에 업로드 후 테스트 결과 동일하였음. => 리스트 상관 없음)

     

  2. 중앙 관리 사이트(SSP-검색관리)에 크롤링 작업을 한 후, 해당 문서에 대해 검색을 해보면 아래 이미지와 같이

    한글이 깨지는 현상이 일어납니다. (아래 검색 결과 페이지의 첫 번째 문서는 UTF-8 인코딩 형식으로 저장된 문서입니다.)

 

  • 크롤링 로그 확인
  1. 중앙 관리 사이트(SSP-검색관리)에 크롤링 로그를 확인하여 보면, 해당 문서에 대해서 크롤링 작업 상태 유형은 성공으로 되었으나,

    아래와 같이 "The document contains invalid utf-8 encoded characters" 라는 메시지가 나와 있습니다.

  2. 해당 메시지가 나온 문서에 대해서는 검색 시 한글이 깨져 표시 됩니다.

    현재 이 유니코드(UTF-8)파일이 아닌 문서에 대한 크롤링 문제 해결 방안을 찾고 있습니다.

+ Recent posts