윈 토토 : 문서 : 9.4 : 윈 토토 | |||
---|---|---|---|
PostgreSQL : 문서 : 9.4 : 토토 결과 최적화 정보 | PostgreSQL : 문서 : 9.4 : SQL 토토 사이트 | 35 장 확장SQL | 다음 |
지금까지 설명한 절차를 통해 새로운 유형, 새로운 기능 및 새로운 운영자를 정의 할 수 있습니다. 그러나 새 데이터 유형의 열에서 아직 토토를 정의 할 수 없습니다.운영자 클래스새 데이터 유형의 경우. 이 섹션의 뒷부분에서 우리는 예를 들어이 개념을 설명합니다. 예를 들어, 절대 값 순서를 올라가는 복소수를 저장하고 정렬하는 B-Tree Index 메소드에 대한 새로운 연산자 클래스..
운영자 클래스를 그룹으로 그룹화 할 수 있습니다운영자 가족의미 적으로 호환되는 클래스 간의 관계를 보여줍니다. 단일 데이터 유형 만 참여하면 운영자 클래스가 충분하므로 먼저 해당 사례에 중점을두고 운영자 패밀리로 돌아갑니다.
thePG_AM
테이블에는 모든 토토 방법에 대해 하나의 행이 포함되어 있습니다 (내부적으로 액세스 방법으로 알려짐). 테이블에 대한 정기적 인 액세스 지원postgresql, 그러나 모든 색인 메소드는에 설명되어 있습니다.PG_AM
. 필요한 인터페이스 루틴을 정의한 다음에서 행을 생성하여 새 인덱스 메소드를 추가 할 수 있습니다.PG_AM
- 그러나 그것은이 장의 범위를 벗어납니다 (참조PostgreSQL : 문서 : 9.4 : 인덱스 토토 꽁 머니 방법 인터페이스 정의).
토토 방법의 루틴은 토토 메소드가 작동하는 데이터 유형에 대해 직접 알지 못합니다. 대신, an운영자 클래스인덱스 메소드가 특정 데이터 유형으로 작업하는 데 사용하는 일련의 작업 세트를 식별합니다. 그들이 지정한 한 가지는이기 때문에 운영자 클래스가 소위 호출됩니다.여기서-인덱스와 함께 사용할 수있는 연산자 (즉, 인덱스 스캔 자격으로 변환 할 수 있음). 운영자 클래스도 일부를 지정할 수 있습니다지원 절차토토 메소드의 내부 작업에 필요하지만 어떤 것도 직접적으로 일치하지 않습니다여기서-토토와 함께 사용할 수있는 클라스 연산자.
동일한 데이터 유형 및 토토 방법에 대해 여러 연산자 클래스를 정의 할 수 있습니다. 이렇게하면 단일 데이터 유형에 대해 여러 세트의 인덱싱 의미를 정의 할 수 있습니다.
동일한 연산자 클래스 이름은 여러 다른 색인 메소드에 사용할 수 있습니다 (예 : B-Tree 및 HASH 색인 메소드는 운영자 클래스가int4_ops), 그러나 각 클래스는 독립적 인 엔티티이며 별도로 정의되어야합니다.
운영자 클래스와 관련된 연산자는에 의해 식별됩니다."전략 번호", 운영자 클래스의 맥락에서 각 연산자의 의미를 식별하는 역할을합니다. 예를 들어, B- 트리는 키에 엄격한 순서를 부과하고, 더 큰 것보다 적고, 운영자는""보다 작습니다.and""보다 크거나 동일합니다.B- 트리와 관련하여 흥미 롭습니다. 왜냐하면postgresql사용자가 연산자를 정의 할 수 있습니다.postgresql연산자의 이름을 볼 수 없습니다 (예 :<또는 =) 그리고 어떤 종류의 비교인지 알려주십시오. 대신 토토 메소드는 세트를 정의합니다."전략", 일반화 된 운영자로 생각할 수 있습니다. 각 운영자 클래스는 특정 데이터 유형에 대한 각 전략 및 인덱스 의미의 해석에 해당하는 실제 연산자가 어떤지 지정합니다..
B- 트리 색인 메소드는 5 가지 전략을 정의합니다.표 35-2.
해시 토토는 평등 비교 만 지원하므로에 표시된 하나의 전략 만 사용합니다.표 35-3.
GIST 토토는 더 유연합니다. 고정 된 전략 세트가 전혀 없습니다. 대신,"일관성"각 특정 GIST 운영자 클래스의 지원 루틴은 전략 번호를 해석하지만 좋아합니다. 예를 들어, 몇몇 내장 GIST 인덱스 운영자 클래스는 2 차원 기하학적 객체를 색인하여를 제공합니다."r-tree"전략에 표시표 35-4. 이들 중 4 개는 진정한 2 차원 테스트 (오버 랩, 동일, 포함)입니다.
표 35-4. GIST 2 차원"r-tree"전략
작동 | 전략 번호 |
---|---|
엄격하게 왼쪽 | 1 |
오른쪽으로 확장되지 않습니다 | 2 |
오버랩 | 3 |
왼쪽으로 확장되지 않습니다 | 4 |
엄격하게 | 5 |
동일 | 6 |
contains | 7 |
포함 | 8 |
위에 확장되지 않습니다 | 9 |
엄격하게 아래 | 10 |
엄격하게 위 | 11 |
아래에 확장되지 않습니다 | 12 |
SP-Gist 인덱스는 유연성의 GIST 인덱스와 유사합니다. 고정 된 전략 세트가 없습니다. 대신 각 운영자 클래스의 지원 루틴은 운영자 클래스의 정의에 따라 전략 번호를 해석합니다.표 35-5.
진 인덱스는 고정 된 전략 세트가 없다는 점에서 GIST 및 SP-GIST 인덱스와 유사합니다. 대신 각 운영자 클래스의 지원 루틴은 운영자 클래스의 정의에 따라 전략 번호를 해석합니다.표 35-6.
위에 나열된 모든 연산자가 부울 값을 반환합니다. 실제로 토토 메서드 검색 연산자로 정의 된 모든 운영자는 유형을 반환해야합니다부울, a의 최상위 레벨에 나타나야하므로여기서토토와 함께 사용할 조항. (일부 토토 액세스 방법도 지원주문 연산자, 일반적으로 부울 값을 반환하지 않습니다. 그 기능은에서 논의됩니다.섹션 35.14.7.)
전략은 일반적으로 시스템이 인덱스 사용 방법을 파악하기에 충분한 정보가 아닙니다. 실제로 인덱스 방법은 작업을 위해 추가 지원 루틴이 필요합니다.
전략과 마찬가지로 운영자 클래스는 주어진 데이터 유형 및 시맨틱 해석에 대해 이러한 각 역할을 수행 해야하는 특정 기능을 식별합니다. 색인 메소드는 필요한 기능 세트를 정의하고 연산자 클래스는에 할당하여 사용할 올바른 기능을 식별합니다."지원 기능 번호"색인 메소드에 의해 지정 됨
B- 트리는 단일 지원 기능이 필요하며,에 표시된대로 운영자 클래스 저자의 옵션에서 두 번째가 제공 할 수 있도록합니다.표 35-7.
표 35-7. B- 트리 지원 기능
기능 | 지원 번호 |
---|---|
두 키를 비교하고 0보다 작은 정수를 0, 0 또는 0보다 더 반환하여 첫 번째 키가 두 번째 또는 두 번째보다 동일인지 또는 얼마나든지를 나타냅니다 | 1 |
C-Callable Sort 지원 기능의 주소를 반환합니다.utils/sortsupport.h(선택 사항) | 2 |
해시 토토는 하나의 지원 함수가 필요합니다.표 35-8.
GIST 토토는 7 개의 지원 함수가 필요하며 선택적 8 번째는표 35-9. (자세한 내용은 참조사설 토토 사이트 : 문서 : 9.4 : Gist Indexes.)
표 35-9. GIST 지원 기능
기능 | 설명 | 지원 번호 |
---|---|---|
일관성 |
키가 쿼리 예선을 만족시키는 지 결정 | 1 |
Union |
열쇠 세트의 Union Compute Union | 2 |
compress |
색인화 할 키 또는 값의 압축 표현 계산 | 3 |
Decompress |
압축 키의 압축 압축 표현 계산 | 4 |
페널티 |
주어진 서브 트리의 키와 함께 새 키를 하위 트리에 삽입 한 페널티 컴퓨팅 | 5 |
picksplit |
새 페이지로 이동할 페이지의 항목을 결정하고 결과 페이지를위한 Union 키를 계산합니다 | 6 |
Equal |
두 개의 키를 비교하고 동등한 경우 true를 반환합니다 | 7 |
거리 |
키에서 쿼리 값까지의 거리 결정 (선택 사항) | 8 |
SP-Gist 인덱스에는 5 가지 지원 기능이 필요합니다.표 35-10. (자세한 내용은 참조PostgreSQL : 문서 : 9.4 : 무지개 토토 Indexes.)
표 35-10. SP-Gist 지원 기능
기능 | 설명 | 지원 번호 |
---|---|---|
config |
운영자 클래스에 대한 기본 정보 제공 | 1 |
선택 |
새 값을 내부 튜플에 삽입하는 방법 결정 | 2 |
picksplit |
값 세트를 분할하는 방법 결정 | 3 |
Inner_consistent |
쿼리를 검색 해야하는 하위 분수 결정 | 4 |
Leaf_consistent |
키가 쿼리 예선을 만족시키는 지 결정 | 5 |
진 인덱스는 4 가지 지원 함수가 필요하며, 다음과 같이 5 분의 1이 필요합니다.표 35-11. (자세한 내용은 참조스포츠 토토 사이트 : 문서 : 9.4 : 진 인덱스.)
표 35-11. 진 지원 기능
기능 | 설명 | 지원 번호 |
---|---|---|
비교 |
두 키를 비교하고 0보다 작은 정수를 0, 0 또는 0보다 더 반환하여 첫 번째 키가 두 번째 또는 두 번째보다 동일인지 또는 얼마나든지를 나타냅니다 | 1 |
ExtractValue |
인덱싱 할 값에서 키를 추출 | 2 |
ExtractQuery |
쿼리 조건에서 키를 추출 | 3 |
일관성 |
값이 쿼리 조건 (부울 변형)과 일치하는지 여부를 결정합니다 (지원 함수가있는 경우 선택 사항 6) | 4 |
비교적 |
인덱스에서 쿼리와 키에서 부분 키를 비교하고 0, 0 또는 0보다 작은 정수를 반환하여 GIN 이이 인덱스 항목을 무시 해야하는지, 항목을 일치로 처리하거나 인덱스 스캔을 중지 해야하는지 | 5 |
triconsistent |
값이 쿼리 조건과 일치하는지 여부 결정 (지원 함수 4가있는 경우 선택 사항) | 6 |
검색 연산자와 달리 지원 함수를 반환하십시오. 특정 인덱스 메소드가 기대하는 데이터 유형; 예를 들어, 서명 된 정수 인 B- 트리의 비교 함수의 경우.
이제 우리는 아이디어를 보았으므로 새로운 운영자 클래스를 만드는 약속 된 예입니다. (이 예제의 작업 사본을 찾을 수 있습니다SRC/Tutorial/Complex.candsrc/튜토리얼/complex.sql소스 분포에서.) 연산자 클래스는 복소수를 절대 값 순서로 정렬하는 연산자를 캡슐화하므로 이름을 선택합니다complex_abs_ops. 먼저, 우리는 일련의 운영자가 필요합니다.PostgreSQL : 문서 : 9.4 : 사용자 정의 토토 사이트. B- 트리의 운영자 클래스의 경우 필요한 운영자는 다음과 같습니다.
관련 비교 연산자 세트를 정의하는 최소 오류가 발생하기 쉬운 방법은 먼저 B-Tree 비교 지원 기능을 작성한 다음 다른 기능을 지원 함수 주변의 한 줄 랩퍼로 작성하는 것입니다. 이것은 코너 케이스에 대한 일관성없는 결과를 얻을 확률을 줄입니다.
#define mag (c) ((c)- x*(c)- x + (c)- y*(c)- y)정적 int
이제 기능보다 적은 기능은 다음과 같습니다.
pg_function_info_v1 (complex_abs_lt);자료
다른 네 가지 함수는 내부 함수의 결과를 0과 비교하는 방법에만 다릅니다.
다음으로 SQL의 함수에 따라 기능과 연산자를 선언합니다.
함수 만들기 complex_abs_lt (complex, complex)를 반환합니다 처럼 'filename','complex_abs_lt ' 언어 C 불변의 엄격;
올바른 통근자 및 부정 자 연산자뿐만 아니라 적절한 제한 및 결합 선택성 함수를 지정하는 것이 중요합니다. 그렇지 않으면 Optimizer가 인덱스를 효과적으로 사용할 수 없습니다. 덜, 평등하고, 더 큰 경우는 다른 선택성 함수를 사용해야한다는 점에 유의하십시오.
주목할만한 다른 일이 여기에서 일어나고 있습니다 :
하나의 연산자 만있을 수 있습니다.=및 유형 가져 오기복잡한두 피연산자 모두. 이 경우 다른 운영자가 없습니다=for복잡한, 그러나 실용적인 데이터 유형을 구축하고 있다면 아마도 원할 것입니다=복소수에 대한 일반 평등 조작 (절대 값의 평등이 아님). 이 경우 다른 운영자 이름을 사용해야합니다.complex_abs_eq
.
비록postgresql다른 인수 데이터 유형이있는 한 동일한 SQL 이름을 가진 함수에 대처할 수 있으며, C는 이름이있는 하나의 전역 기능에만 대처할 수 있습니다. 그래서 우리는 C 기능의 이름을 단순한 것과 같은 이름으로 지정해서는 안됩니다abs_eq. 일반적으로 다른 데이터 유형의 함수와 충돌하지 않도록 데이터 유형 이름을 C 함수 이름에 포함시키는 것이 좋습니다.
우리는 함수의 SQL 이름을 만들 수있었습니다abs_eq, 의존postgresql동일한 이름의 다른 SQL 함수와 인수 데이터 유형에 의해 구별됩니다. 예제를 단순하게 유지하기 위해 함수의 이름을 C 레벨과 SQL 레벨에서 동일한 이름으로 만듭니다.
다음 단계는 B- 트리가 요구하는 지원 루틴의 등록입니다. 이것을 구현하는 예제 코드는 연산자 함수를 포함하는 동일한 파일에 있습니다.
함수 만들기 complex_abs_cmp (complex, complex) 정수를 반환합니다filename' 언어 c 불변의 엄격한;
이제 필요한 연산자와 지원 루틴이 있으므로 결국 연산자 클래스를 만들 수 있습니다.
운영자 클래스 Complex_abs_ops 작성 btree as를 사용하여 유형 복합체의 기본값
그리고 우리는 끝났습니다! 이제 b- 트리 색인을 생성하고 사용하는 것이 가능해야합니다복잡한열.
우리는 다음과 같이 운영자 항목을 더 구두로 쓸 수있었습니다.
연산자 1 <(복잡한, 복잡한),
그러나 운영자가 동일한 데이터 유형을 취할 때 그렇게 할 필요는 없습니다.
위의 예는이 새로운 운영자 클래스를 기본 B-Tree 운영자 클래스로 만들고 싶다고 가정합니다.복잡한데이터 유형. 그렇지 않으면 그냥 그 단어를 남겨주세요기본값.
지금까지 우리는 운영자 클래스가 하나의 데이터 유형만을 다루고 있다고 암시 적으로 가정했습니다. 특정 인덱스 열에는 하나의 데이터 유형 만있을 수 있지만 인덱스 된 열을 다른 데이터 유형의 값과 비교하는 인덱스 작업에 종종 유용합니다.
이러한 요구를 처리하려면postgresqlAN의 개념 사용운영자 가족. 운영자 패밀리에는 하나 이상의 운영자 클래스가 포함되어 있으며 가족 전체에 속하지만 가족 내의 단일 클래스에는 포함되지 않는 인덱스 가능한 운영자 및 해당 지원 기능도 포함 할 수 있습니다."느슨한"특정 클래스에 묶여있는 것이 아니라 가족 내에서. 일반적으로 각 운영자 클래스는 단일 데이터 유형 연산자가 포함되어 있고 크로스 데이터 유형 연산자는 가족이 느슨합니다.
운영자 패밀리의 모든 연산자와 기능에는 호환성 요구 사항이 인덱스 메소드에 의해 설정되는 호환 시맨틱이 있어야합니다. 그러므로 당신은 왜 왜 가족의 특정 하위 집합을 운영자 수업으로 단독으로 짜는 것을 귀찮게하는지 궁금 할 것입니다.
예를 들어postgresql내장 B- 트리 운영자 제품군이 있습니다integer_ops, 여기에는 운영자 클래스 포함int8_ops, int4_ops및int2_opsindexes onbigint (int8), Integer (int4) 및smallint (int2) 열.
btree를 사용하여 운영자 패밀리 integer_ops 만들기;연산자 클래스 int8_ops를 만듭니다
이 정의를 주목하십시오"오버로드"운영자 전략 및 지원 기능 번호 : 각 숫자는 가족 내에서 여러 번 발생합니다. 특정 숫자의 각 인스턴스에 별개의 입력 데이터 유형이있는 한 이는 허용됩니다.
B-Tree 운영자 제품군에서 가족의 모든 운영자는 양립적으로 정렬해야합니다. 즉, 전이 법률이 가족이 지원하는 모든 데이터 유형에 걸쳐 보유 함을 의미합니다."a = b 및 b = c 인 경우 a = c"및"a . 또한, 운영자 패밀리에 표시된 유형간에 암시 적 또는 이진 강요 캐스트는 관련 정렬 순서를 변경해서는 안됩니다.
다중 데이터 유형 해시 운영자 제품군을 구축하려면 가족이 지원하는 각 데이터 유형에 대해 호환 해시 지원 기능을 작성해야합니다. 여기서 호환성은 함수가 값이 다른 유형 인 경우에도 가족의 평등 연산자가 동일하게 간주되는 두 값에 대해 동일한 해시 코드를 반환하도록 보장 함을 의미합니다.
GIST, SP-GIST 및 GIN Indexes는 교차 데이터 유형 작업에 대한 명시적인 개념이 없습니다. 지원되는 연산자 세트는 주어진 운영자 클래스의 기본 지원 기능이 처리 할 수있는 모든 것입니다.
참고 :이전postgresql8.3, 운영자 패밀리의 개념은 없었으므로 인덱스와 함께 사용하려는 모든 교차 데이터 유형 연산자는 인덱스의 운영자 클래스에 직접 묶어야했습니다. 이 접근법은 여전히 작동하지만 인덱스의 종속성을 너무 광범위하게 만들기 때문에 더 이상 사용되지 않으며 플래너는 두 데이터 유형이 동일한 운영자 패밀리에서 운영자를 가질 때 더 효과적으로 데이터 유형 비교를 처리 할 수 있기 때문에.
postgresql운영자 클래스를 사용하여 인덱스와 함께 사용할 수 있는지 여부보다 더 많은 방법으로 연산자의 속성을 유추합니다. 따라서 데이터 유형의 열을 인덱싱하려는 의도가 없어도 운영자 클래스를 생성 할 수 있습니다.
특히와 같은 SQL 기능이 있습니다.주문and별도의값의 비교 및 분류가 필요합니다. 사용자 정의 데이터 유형에서 이러한 기능을 구현하려면postgresql데이터 유형의 기본 B-Tree 연산자 클래스를 찾습니다. 그만큼"Equals"이 운영자 클래스의 구성원은 시스템의 가치 평등 개념을 정의합니다그룹 byand별도의, 그리고 운영자 클래스가 부과하는 정렬 순서는 기본값을 정의합니다주문주문.
사용자 정의 유형의 배열 비교도 기본 B-Tree 연산자 클래스에 의해 정의 된 의미론에 의존합니다.
데이터 유형에 대한 기본 B-Tree 연산자 클래스가 없으면 시스템은 기본 해시 운영자 클래스를 찾습니다. 그러나 이러한 종류의 운영자 클래스는 평등만을 제공하기 때문에 실제로 배열 평등을 지원하기에 충분합니다.
데이터 유형에 대한 기본 연산자 클래스가 없으면와 같은 오류가 발생합니다."주문 연산자를 식별 할 수 없습니다"이 SQL 기능을 데이터 유형과 함께 사용하려고하면
참고 :inpostgresql7.4 전의 버전, 정렬 및 그룹화 작업은 암시 적으로 운영자라는 이름의 운영자를 사용합니다=, <및. 기본 연산자 클래스에 의존하는 새로운 동작은 특정 이름을 가진 연산자의 동작에 대해 가정하지 않아도됩니다.
또 다른 중요한 점은 해시 운영자 제품군에 나타나는 연산자가 해시 조인, 해시 집계 및 관련 최적화의 후보라는 것입니다. 해시 운영자 제품군은 사용할 해시 함수를 식별하기 때문에 필수적입니다.
일부 인덱스 액세스 방법 (현재, 요점 만)의 개념을 지원합니다주문 연산자. 우리가 지금까지 논의한 것은검색 연산자. 검색 연산자는 인덱스를 검색하여 모든 행을 만족시키는 모든 행을 찾을 수있는 것입니다여기서 indexed_column 운영자 Constant. 일치하는 행이 반환되는 순서에 대해 약속 된 것은 없습니다.주문 indexed_column 운영자 Constant. 운영자가 거리를 측정하는 경우 가장 가까운 이웃 검색을 지원하기 때문입니다.
선택 * 위치별로 주문 <- 포인트 '(101,456)'Limit 10;
주어진 목표 지점에 가장 가까운 10 개의 장소를 찾습니다. 위치 열의 GIST 지수는이를 효율적으로 수행 할 수 있습니다.<--주문 연산자입니다.
검색 연산자는 부울 결과를 반환해야하지만 주문 연산자는 일반적으로 플로트 또는 숫자와 같은 다른 유형을 반환합니다. 이 유형은 일반적으로 인덱싱되는 데이터 유형과 동일하지 않습니다.postgresql의 주문 개념이므로 자연스럽게 표현됩니다. 포인트 이후<--운영자 반환float8, 다음과 같은 연산자 클래스 작성 명령에 지정할 수 있습니다.
Operator 15 <- (Point, Point) float_ops에 의한 순서
여기서float_opsfloat8. 이 선언은 토토가 값의 값을 높이기 위해 행을 반환 할 수 있다고 명시합니다<--운영자.
가장 일반적으로 사용되는 인덱스 방법에 유용하지 않기 때문에 아직 논의하지 않은 운영자 클래스의 두 가지 특수 기능이 있습니다.
일반적으로, 연산자를 연산자 클래스 (또는 가족)의 구성원으로 선언한다는 것은 인덱스 메소드가 A를 만족시키는 행 세트를 정확하게 검색 할 수 있음을 의미합니다.여기서연산자를 사용한 상태. 예를 들어:
선택 *에서 integer_column <4; 테이블에서
정수 열의 B-Tree 지수에 의해 정확히 충족 될 수 있습니다. 그러나 토토가 일치하는 행에 대한 부지런한 안내서로 유용한 경우가 있습니다.여기서테스트를 테스트하는 조건 다각형과 같은 비정형 물체 사이에 겹치는 조건. 그러나 우리는 인덱스를 사용하여 경계 상자가 대상 객체의 경계 상자와 겹치는 객체를 찾은 다음 인덱스가 발견 한 객체에서만 정확한 오버랩 테스트를 수행 할 수 있습니다."Lossy"운영자. Lossy Index 검색은 인덱스 메소드를 반환하여 구현됩니다.Recheck행이 쿼리 조건을 만족 시키거나 실제로 만족하지 못할 때 플래그. 그런 다음 핵심 시스템은 검색된 행의 원래 쿼리 조건을 테스트하여 유효한 일치로 반환 해야하는지 확인합니다.
우리가 토토 저장하는 상황을 다시 고려하십시오. 이 경우 인덱스 항목에 전체 다각형을 저장하는 데는 별다른 가치가 없습니다. 우리는 더 간단한 유형 객체를 저장할 수도 있습니다.Box. 이 상황은에 의해 표현됩니다.스토리지옵션운영자 클래스 만들기: 우리는 다음과 같은 글을 쓸 것입니다.
운영자 클래스 Polygon_ops를 만듭니다 GIST AS를 사용하여 유형 다각형의 기본값
현재, GIST 및 GIN 색인 메소드 만 지원 A스토리지열 데이터 유형과 다른 유형. The Gistcompress
andDecompress
지원 루틴은 데이터 유형 변환을 처리해야합니다.스토리지사용됩니다. 진에서스토리지유형의 유형을 식별합니다"키"일반적으로 토토 열의 유형과 다른 값 (예 : 정수 배열 열에 대한 연산자 클래스에는 정수 인 키가있을 수 있습니다. 진ExtractValue
andExtractQuery
지원 루틴은 토토 값에서 키를 추출 할 책임이 있습니다.