-
SharePoint Search 테스트 시나리오
-
아래 그림과 같이 인코딩 형식을 유니코드(UTF-8) 형식으로 저장한 eml 파일과
한국어(EUC-KR) 형식으로 저장한 eml 파일이 있습니다.
-
위 2가지 형태로 저장한 eml 파일을 Document Library에 업로드합니다.
(Document Library 뿐만 아니라 그 외 Custom List의 Attachment에 업로드 후 테스트 결과 동일하였음. => 리스트 상관 없음)
-
중앙 관리 사이트(SSP-검색관리)에 크롤링 작업을 한 후, 해당 문서에 대해 검색을 해보면 아래 이미지와 같이
한글이 깨지는 현상이 일어납니다. (아래 검색 결과 페이지의 첫 번째 문서는 UTF-8 인코딩 형식으로 저장된 문서입니다.)
-
크롤링 로그 확인
-
중앙 관리 사이트(SSP-검색관리)에 크롤링 로그를 확인하여 보면, 해당 문서에 대해서 크롤링 작업 상태 유형은 성공으로 되었으나,
아래와 같이 "The document contains invalid utf-8 encoded characters" 라는 메시지가 나와 있습니다.
-
해당 메시지가 나온 문서에 대해서는 검색 시 한글이 깨져 표시 됩니다.
현재 이 유니코드(UTF-8)파일이 아닌 문서에 대한 크롤링 문제 해결 방안을 찾고 있습니다.
'Solution Platform' 카테고리의 다른 글
[MSDN 펌]How to find out the storage space allocation details a site through code (0) | 2010.01.29 |
---|---|
Custom Site Template 간단하게 만들어 보자.. (0) | 2009.11.17 |
FullTextSqlQuery를 이용한 검색 샘플 소스 및 주의 사항 (0) | 2009.09.21 |
[번역본]LogParser를 이용한 SharePoint 운영 현황 분석 (0) | 2009.09.21 |
Syncronization of Office Document Properties with WSS Document Libraries (0) | 2009.09.21 |