Serviço de otimização de pesquisa¶

O serviço de otimização de pesquisa pode melhorar significativamente o desempenho de certos tipos de busca e consultas analíticas. Há suporte para um amplo conjunto de predicados de filtragem (consulte Identificação de consultas que podem se beneficiar da otimização de pesquisa).

Nota

Para começar com um tutorial que compara o tempo de execução com e sem otimização de pesquisa, consulte Como começar com otimização de pesquisa

O serviço de otimização de pesquisa visa melhorar significativamente o desempenho de certos tipos de consultas em tabelas, incluindo:

Consultas de pesquisas pontuais seletivas em tabelas. Uma consulta de pesquisa pontual retorna apenas uma ou um pequeno número de linhas distintas. Exemplos de casos de uso incluem:
- Usuários comerciais que precisam de tempos de resposta rápidos para painéis críticos com filtros altamente seletivos.
- Cientistas de dados que estão explorando grandes volumes de dados e procurando por subconjuntos específicos de dados.
- Aplicativos de dados que recuperam um pequeno conjunto de resultados com base em um extenso conjunto de predicados de filtragem.
Para obter mais informações, consulte Aceleração de consultas de pesquisa de pontos com otimização de pesquisa.
Pesquisas de dados de caracteres (texto) e endereços IP executadas com as funções SEARCH e SEARCH_IP. Para obter mais informações, consulte Aceleração de consultas de texto com otimização de pesquisa.
Pesquisas de substrings e expressões regulares (por exemplo, LIKE, ILIKE, RLIKE e assim por diante). Para obter mais informações, consulte Aceleração consultas de subcadeias de caracteres e expressões regulares com otimização de pesquisa.
Consultas sobre elementos nas colunas VARIANT, OBJECT e ARRAY (semiestruturadas) que usam os seguintes tipos de predicados:
- Predicados de igualdade.
- Predicados IN.
- Predicados que usam ARRAY_CONTAINS.
- Predicados que usam ARRAYS_OVERLAP.
- Predicados que usam pesquisa de texto completo com SEARCH.
- Predicados de expressão regular e subcadeia de caracteres
- Predicados que verificam valores NULL:
Para obter mais informações, consulte Aceleração de consultas de dados semiestruturados com otimização de pesquisa.
Consultas sobre elementos nas colunas ARRAY, OBJECT e MAP estruturadas que usam os seguintes tipos de predicados:
- Predicados de igualdade.
- Predicados IN.
- Predicados de substring (em campos STRING).
Para obter mais informações, consulte Acelerando as consultas de dados estruturados com a otimização de pesquisa.
Consultas que utilizam funções geoespaciais selecionadas com valores GEOGRAPHY. Para obter mais informações, consulte Aceleração de consultas geoespaciais com otimização de pesquisa.

Uma vez identificadas as consultas que podem se beneficiar do serviço de otimização de pesquisa, você pode ativar a otimização de pesquisa para as colunas e tabelas utilizadas nessas consultas.

O serviço de otimização de pesquisa é geralmente transparente para os usuários. As consultas funcionam da mesma forma que sem otimização de pesquisa; algumas são apenas mais rápidas. No entanto, a otimização de pesquisa tem efeitos em outras operações de tabela. Para obter mais informações, consulte Como trabalhar com tabelas otimizadas para pesquisa.

Como funciona o serviço de otimização de pesquisa¶

Para melhorar o desempenho das consultas de pesquisa, o serviço de otimização de pesquisa cria e mantém uma estrutura de dados persistente chamada caminho de acesso de pesquisa. O caminho de acesso de pesquisa mantém o controle de quais valores das colunas da tabela podem ser encontrados em cada uma de suas micropartições, permitindo que algumas micropartições sejam ignoradas durante a varredura da tabela.

Um serviço de manutenção é responsável pela criação e manutenção do caminho de acesso de pesquisa:

Quando você habilita a otimização de pesquisa, o serviço de manutenção cria e preenche o caminho de acesso de pesquisa com os dados necessários para realizar as buscas.

A criação do caminho de acesso de pesquisa pode levar um tempo significativo, dependendo do tamanho da tabela. O serviço de manutenção faz este trabalho em segundo plano e não bloqueia nenhuma operação na tabela. As consultas não são aceleradas até que o caminho de acesso à pesquisa tenha sido totalmente criado.
Quando os dados na tabela são atualizados (por exemplo, carregando novos conjuntos de dados ou através de operações DML), o serviço de manutenção atualiza automaticamente o caminho de acesso de pesquisa para refletir as mudanças nos dados.

Se as consultas forem executadas enquanto o caminho de acesso de pesquisa ainda estiver sendo atualizado, as consultas poderão ser executadas mais lentamente, mas ainda assim retornarão resultados corretos.

O progresso do serviço de manutenção de cada tabela aparece na coluna search_optimization_progress na saída de SHOW TABLES. Antes de medir a melhoria do desempenho da otimização de pesquisa em uma tabela recém-otimizada, certifique-se de que a coluna mostre que a tabela foi totalmente otimizada.

A manutenção do caminho de acesso de pesquisa é transparente. Você não precisa criar um warehouse virtual para executar o serviço de manutenção. No entanto, há um custo para os recursos de armazenamento e computação de manutenção. Para obter mais detalhes sobre custos, consulte Estimativa e gerenciamento de custos de otimização de pesquisa.

Outras opções para otimizar o desempenho da consulta¶

O serviço de otimização de pesquisa é uma das várias maneiras de otimizar o desempenho da consulta. A lista a seguir mostra outras técnicas:

Aceleração de consulta
Criação de uma ou mais exibições materializadas (clusterizadas ou não)
Clustering de uma tabela

Para obter mais informações, consulte Otimização do desempenho da consulta.

Exemplos¶

Comece criando uma tabela com dados:

CREATE OR REPLACE TABLE test_table (id INT, c1 INT, c2 STRING, c3 DATE) AS
  SELECT * FROM VALUES
    (1, 3, '4',  '1985-05-11'),
    (2, 4, '3',  '1996-12-20'),
    (3, 2, '1',  '1974-02-03'),
    (4, 1, '2',  '2004-03-09'),
    (5, NULL, NULL, NULL);

Adicione a propriedade SEARCH OPTIMIZATION à tabela usando ALTER TABLE:

ALTER TABLE test_table ADD SEARCH OPTIMIZATION;

As consultas a seguir podem utilizar o serviço de otimização de pesquisa:

SELECT * FROM test_table WHERE id = 2;

SELECT * FROM test_table WHERE c2 = '1';

SELECT * FROM test_table WHERE c3 = '1985-05-11';

SELECT * FROM test_table WHERE c1 IS NULL;

SELECT * FROM test_table WHERE c1 = 4 AND c3 = '1996-12-20';

A consulta seguinte pode utilizar o serviço de otimização de pesquisa porque a conversão implícita está na constante, não na coluna:

SELECT * FROM test_table WHERE c2 = 2;

O seguinte não pode usar o serviço de otimização de pesquisa porque a conversão está na coluna da tabela:

SELECT * FROM test_table WHERE CAST(c2 AS NUMBER) = 2;

Uma cláusula IN é suportada pelo serviço de otimização de pesquisa:

SELECT id, c1, c2, c3
  FROM test_table
  WHERE id IN (2, 3)
  ORDER BY id;

Se os predicados forem suportados individualmente por um serviço de otimização de pesquisa, eles poderão ser unidos pela conjunção AND e ainda serem suportados pelo serviço de otimização de pesquisa:

SELECT id, c1, c2, c3
  FROM test_table
  WHERE c1 = 1
    AND c3 = TO_DATE('2004-03-09')
  ORDER BY id;

DELETE e UPDATE (e MERGE) também pode utilizar o serviço de otimização de pesquisa:

DELETE FROM test_table WHERE id = 3;

UPDATE test_table SET c1 = 99 WHERE id = 4;