롤 토토 : 문서 : 9.5 : 롤 토토 | |||
---|---|---|---|
토토 베이 : 문서 : 9.5 : 추가 토토 베이 | 토토 사이트 추천 : 문서 : 9.5 : 전문 검색 | 12 장. 전문 검색 | PostgreSQL : 문서 : 9.5 : 토토 베이 |
텍스트 검색 배트맨 토토가 원시 문서 텍스트를 분할 할 책임이 있습니다토큰및 가능한 유형 세트가 파서 자체에 의해 정의되는 각 토큰 유형을 식별합니다. 파서는 텍스트를 전혀 수정하지 않으며 단순히 그럴듯한 단어 경계를 식별합니다.postgresql광범위한 애플리케이션에 유용한 것으로 밝혀진 단 하나의 내장 된 배트맨 토토를 제공합니다.
내장 된 배트맨 토토의 이름이 지정되었습니다pg_catalog.default. 23 개의 토큰 유형을 인식합니다.표 12-1.
표 12-1. 기본 파서의 토큰 유형
참고 :배트맨 토토의 개념"Letter"데이터베이스의 로케일 설정에 따라 결정됩니다.LC_CTYPE. 기본 ASCII 문자 만 포함하는 단어는 때로는 별도의 토큰 유형으로보고됩니다. 때로는 구별하는 것이 유용하기 때문입니다.Wordandasciiword똑같이 취급해야합니다.
이메일RFC 5322에 의해 정의 된 모든 유효한 이메일 문자를 지원하지는 않습니다. 특히, 이메일 사용자 이름을 위해 지원되는 유일한 비 알파 너매 문자는 기간, 대시 및 밑줄입니다..
파서가 같은 텍스트에서 겹치는 토큰을 생성 할 수 있습니다. 예를 들어, 하이픈으로 된 단어는 전체 단어와 각 구성 요소로보고됩니다.
TS_DEBUG의 별명, 설명, 토큰 선택 ( 'foo-bar-beta1');
이 동작은 전체 복합 단어와 구성 요소 모두에 대한 검색이 작동하도록 허용하기 때문에 바람직합니다. 다음은 또 다른 유익한 예입니다.
TS_DEBUG의 별명, 설명, 토큰 선택 ( 'http://example.com/stuff/index.html');