이 문서는 지원되지 않는 버전의 PostgreSQL을위한 것입니다.
당신은에 대해 같은 페이지를 볼 수 있습니다PostgreSQL : 문서 : 17 : F.46. UNCENCER - Diacritics를 제거하는 텍스트 검색 스포츠 토토 결과버전 또는 위에 나열된 다른 지원 버전 중 하나입니다.

F.42. uncent

Unaccentlexemes에서 악센트 (diacritic signs)를 제거하는 텍스트 검색 사전입니다. 필터링 사전으로, 사전의 정상적인 동작과 달리 출력이 항상 다음 사전 (있는 경우)으로 전달됩니다.

현재의 구현Unaccent정상화 사전으로 사용할 수 없습니다THESAURUS사전.

F.42.1. 구성

anUnaccent사전은 다음 옵션을 수락합니다.

  • 규칙는 번역 규칙 목록을 포함하는 파일의 기본 이름입니다. 이 파일은에 저장해야합니다.$ sharedir/tsearch_data/(where$ sharedir의미토토설치의 공유 데이터 디렉토리). 그 이름은 끝나야합니다.RULES(규칙매개 변수).

규칙 파일에는 다음 형식이 있습니다.

  • 각 줄은 하나의 번역 규칙을 나타냅니다. 첫 번째는 두 번째로 번역됩니다.

    à a

    두 문자는 공백으로 분리되어야하며, 라인의 선두 또는 후행 공백은 무시됩니다.

  • 또는 한 줄에 한 문자 만 주어지면 해당 문자의 인스턴스가 삭제됩니다. 이것은 악센트가 별도의 문자로 표시되는 언어에 유용합니다.

  • 실제로, 각각"문자"whitespace를 포함하지 않는 문자열 일 수 있습니다.Unaccent사전은 diacritic 제거 외에 다른 종류의 기판 치환에 사용될 수 있습니다.

  • 다른 것과 마찬가지로토토텍스트 검색 구성 파일, 규칙 파일은 UTF-8 인코딩에 저장해야합니다. 데이터는로드시 현재 데이터베이스의 인코딩으로 자동으로 변환됩니다.

대부분의 유럽 언어에 직접 유용한보다 완전한 예는 찾을 수 있습니다.Unaccent,$ sharedir/tsearch_data/언제Unaccent모듈이 설치되었습니다.

F.42.2. 용법

설치Unaccent확장자 텍스트 검색 템플릿을 만듭니다Unaccent및 사전Unaccent기준. 그만큼UnaccentDictionary는 기본 매개 변수 설정이 있습니다규칙 = 'unccent', 이로 인해 표준으로 즉시 사용할 수 있습니다Unaccent파일. 원한다면 매개 변수를 변경할 수 있습니다 (예 :

mydb =# Alter Text 검색 사전 Unaccent (Rules = 'my_rules');

또는 템플릿을 기반으로 새로운 사전을 만듭니다.

사전을 테스트하려면 시도 할 수 있습니다.

mydb =# select ts_lexize ( 'unccent', 'hôtel');

삽입 방법을 보여주는 예가 있습니다Unaccent텍스트 검색 구성으로의 사전 :

mydb =# 텍스트 검색 구성 fr (copy = french);

F.42.3. 기능

theUnaccent ()함수는 주어진 문자열에서 액센트 (Diacritic Signs)를 제거합니다. 기본적으로 래퍼Unaccent-유형 사전, 그러나 일반 텍스트 검색 컨텍스트 외부에서 사용할 수 있습니다.

Unaccent ([Dictionary Regdictionary, ] String 텍스트) 반환텍스트

Dictionary인수가 생략되었고, 텍스트 검색 사전이라는Unaccent|Unaccent ()함수 자체가 사용됩니다.

예 :

선택 Unaccent ( 'Unaccent', 'Hôtel')를 선택하십시오.