롤 토토 : 문서 : 9 | |||
---|---|---|---|
이전 | up | 부록 F. 추가 공급 모듈 | 다음 |
Unaccentlexemes에서 악센트 (diacritic signs)를 제거하는 텍스트 검색 사전입니다. 필터링 사전으로, 사전의 정상적인 동작과 달리 출력이 항상 다음 사전 (있는 경우)으로 전달됩니다.
현재의 구현Unaccent정상화 사전으로 사용할 수 없습니다THESAURUS사전.
anUnaccent사전은 다음 옵션을 수락합니다.
규칙는 번역 규칙 목록을 포함하는 파일의 기본 이름입니다. 이 파일은에 저장해야합니다.$ sharedir/tsearch_data/(where$ sharedir의미토토설치의 공유 데이터 디렉토리). 그 이름은 끝나야합니다.RULES(규칙매개 변수).
규칙 파일에는 다음 형식이 있습니다.
각 줄은 하나의 번역 규칙을 나타냅니다. 첫 번째는 두 번째로 번역됩니다.
à a
두 문자는 공백으로 분리되어야하며, 라인의 선두 또는 후행 공백은 무시됩니다.
또는 한 줄에 한 문자 만 주어지면 해당 문자의 인스턴스가 삭제됩니다. 이것은 악센트가 별도의 문자로 표시되는 언어에 유용합니다.
실제로, 각각"문자"whitespace를 포함하지 않는 문자열 일 수 있습니다.Unaccent사전은 diacritic 제거 외에 다른 종류의 기판 치환에 사용될 수 있습니다.
다른 것과 마찬가지로토토텍스트 검색 구성 파일, 규칙 파일은 UTF-8 인코딩에 저장해야합니다. 데이터는로드시 현재 데이터베이스의 인코딩으로 자동으로 변환됩니다.
대부분의 유럽 언어에 직접 유용한보다 완전한 예는 찾을 수 있습니다.Unaccent,$ sharedir/tsearch_data/언제Unaccent모듈이 설치되었습니다.
설치Unaccent확장자 텍스트 검색 템플릿을 만듭니다Unaccent및 사전Unaccent기준. 그만큼UnaccentDictionary는 기본 매개 변수 설정이 있습니다규칙 = 'unccent', 이로 인해 표준으로 즉시 사용할 수 있습니다Unaccent파일. 원한다면 매개 변수를 변경할 수 있습니다 (예 :
mydb =# Alter Text 검색 사전 Unaccent (Rules = 'my_rules');
또는 템플릿을 기반으로 새로운 사전을 만듭니다.
사전을 테스트하려면 시도 할 수 있습니다.
mydb =# select ts_lexize ( 'unccent', 'hôtel');
삽입 방법을 보여주는 예가 있습니다Unaccent텍스트 검색 구성으로의 사전 :
mydb =# 텍스트 검색 구성 fr (copy = french);
theUnaccent ()
함수는 주어진 문자열에서 액센트 (Diacritic Signs)를 제거합니다. 기본적으로 래퍼Unaccent-유형 사전, 그러나 일반 텍스트 검색 컨텍스트 외부에서 사용할 수 있습니다.
Unaccent ([Dictionary Regdictionary, ] String 텍스트) 반환텍스트
Dictionary인수가 생략되었고, 텍스트 검색 사전이라는Unaccent|Unaccent ()
함수 자체가 사용됩니다.
예 :
선택 Unaccent ( 'Unaccent', 'Hôtel')를 선택하십시오.
이전 | 롤 토토 : 문서 : 9.5 : 롤 토토 9.5.25 문서화 | 다음 |
TSM_SYSTEM_TIME | up | uuid-sossp |