Compreensão da inicialização e atualização de tabelas dinâmicas¶

O conteúdo de uma tabela dinâmica é definido por uma consulta e é atualizado automaticamente – chamado de atualização – quando os dados subjacentes são alterados. Esse processo analisa a consulta para manter a tabela atualizada.

Nota

As informações neste tópico se aplicam a tabelas dinâmicas com o atributo SCHEDULER definido como ENABLE ou não definido explicitamente. Tabelas dinâmicas com o atributo SCHEDULER definido como DISABLE só podem ser atualizadas manualmente. Para obter mais informações, consulte Atualize manualmente as tabelas dinâmicas.

As seções a seguir explicam a atualização dinâmica da tabela com mais detalhes:


Seção	Descrição
Compreensão da inicialização de tabelas dinâmicas	Introduz a inicialização ou, em outras palavras, a população inicial de dados quando você cria uma tabela dinâmica. Você pode especificar quando ocorre a atualização inicial.
Entendendo as opções de atualização manual e programada	Uma visão geral da atualização dinâmica de tabelas. As tabelas dinâmicas são atualizadas em um cronograma, a menos que sejam atualizadas manualmente.
Modos de atualização de tabelas dinâmicas	As tabelas dinâmicas são compatíveis com diferentes modos de atualização: incremental, completa e AUTO.
Como os dados são atualizados quando uma tabela dinâmica depende de outras tabelas dinâmicas	Saiba como as tabelas dinâmicas são atualizadas em relação às suas dependências.
Como compreender os efeitos das alterações nas colunas das tabelas de base

Compreensão da inicialização de tabelas dinâmicas¶

Quando você cria uma tabela dinâmica, a atualização inicial ocorre de forma síncrona na criação ou em um horário programado. O preenchimento inicial de dados, ou inicialização, depende de quando a atualização inicial ocorre.

As tabelas dinâmicas são atualizadas com base no atraso de destino especificado, que define o atraso máximo permitido entre as atualizações das tabelas base e o conteúdo da tabela dinâmica. Se você definir INITIALIZE = ON_CREATE (padrão), a tabela será inicializada imediatamente. Se você definir INITIALIZE = ON_SCHEDULE, a inicialização ocorrerá dentro do período de atraso de destino especificado.

Por exemplo, considere uma tabela dinâmica, DT1, com um atraso de destino de 30 minutos. O preenchimento inicial de dados para DT1 pode ocorrer da seguinte forma:

Se DT1 estiver configurada para ser atualizada de forma síncrona na criação (ON_CREATE), ela será inicializada na criação.
Se DT1 estiver configurada para ser atualizada em um horário programado (ON_SCHEDULE), ela será inicializada em 30 minutos.

Em cenários com dependências downstream, o comportamento de atualização depende das dependências. Por exemplo, se a tabela dinâmica DT1 tiver um atraso de destino downstream e DT2, que depende de DT1, tiver um atraso de destino de 30 minutos, DT1 será atualizada somente quando DT2 for atualizada.

Para DT1:

Se for definido para atualizar de forma síncrona na criação, ela será inicializada imediatamente. Se a inicialização falhar, o processo de criação será interrompido, fornecendo feedback imediato sobre quaisquer erros.
Se for definida para atualizar em um horário programado, a inicialização dependerá de quando DT2 for atualizada.

A inicialização pode levar algum tempo, dependendo da quantidade de dados digitalizados. Para acompanhar o progresso, consulte Solução de problemas de criação de tabela dinâmica.

Entendendo as opções de atualização manual e programada¶

As tabelas dinâmicas são atualizadas em um cronograma determinado pelo atraso de destino. Toda vez que uma tabela dinâmica é lida, a atualização dos dados está dentro do período de tempo definido pelo atraso de destino.

Você pode atualizar manualmente suas tabelas dinâmicas para obter os dados mais recentes usando o comando ALTER DYNAMIC TABLE … REFRESH ou Snowsight. Para obter mais informações, consulte Atualize manualmente as tabelas dinâmicas.

Os tempos limite de atualização de tabela dinâmica são controlados pelo parâmetro STATEMENT_TIMEOUT_IN_SECONDS, que define a duração máxima permitida no nível da conta ou do warehouse antes que uma atualização seja automaticamente cancelada.

Como o atraso de destino afeta as atualizações programadas¶

A atraso de destino controla a frequência das atualizações programadas. Para gerenciar manualmente as atualizações, defina a atraso de destino de sua tabela dinâmica como DOWNSTREAM e certifique-se de que todas as tabelas dinâmicas downstream também estejam definidas como DOWNSTREAM.

Definir o atraso de destino de todo o gráfico acíclico dirigido (DAG) como DOWNSTREAM basicamente desativa as atualizações programadas porque a tabela dinâmica final controla o cronograma de atualização. Se nenhuma tabela dinâmica tiver um atraso de destino baseado em tempo, o pipeline será suspenso para atualizações programadas. Nesse caso, a atualização manual da tabela mais downstream atualiza automaticamente todas as dependências upstream.

Definir a atraso de destino para DOWNSTREAM não especifica o tempo exato. Em vez disso, o Snowflake escolhe uma cadência de atualização para tentar manter o atraso abaixo do valor de destino. Por exemplo, uma tabela dinâmica com um atraso de destino de 4 horas pode ser atualizada a cada 3,5 horas.

Para especificar os horários exatos, você pode usar uma tarefa com um cronograma CRON em comum. Para mais informações, consulte Atualize manualmente as tabelas dinâmicas.

Modos de atualização de tabelas dinâmicas¶

As tabelas dinâmicas são compatíveis com três modos de atualização: automática, incremental e completa. Você pode definir o modo de atualização como AUTO ou configurá-lo explicitamente:

Modo de atualização AUTO: ao usar o parâmetro AUTO, o Snowflake seleciona automaticamente o modo de atualização mais econômico e rápido com base na complexidade da consulta, construções aceitas, operadores, funções e desempenho esperado. Essa decisão é tomada apenas uma vez, no momento da criação da tabela. Se a atualização incremental for sem suporte ou ineficiente, o Snowflake escolhe a atualização completa.

Por exemplo, se uma tabela dinâmica fizer referência a uma exibição e a definição da exibição for alterada de forma assíncrona, o modo de atualização permanecerá inalterado. Se a decisão original foi incremental, mas se tornar sem suporte (por exemplo, devido a uma alteração na exibição a montante), a atualização falhará com um erro como Dynamic table can no longer be refreshed incrementally because an upstream view changed..

Para alterar o modo de atualização, recrie a tabela dinâmica usando o comando CREATE OR REPLACE DYNAMIC TABLE.
Modo de atualização incremental: esse modo analisa a consulta da tabela dinâmica e calcula as alterações desde a última atualização. Em seguida, ele mescla essas alterações na tabela.
Modo de atualização completa: esse modo executa a consulta da tabela dinâmica e substitui completamente os resultados materializados anteriormente.

Para obter orientações sobre quando usar a atualização incremental em vez da atualização completa, consulte Escolher um modo de atualização. Para verificar qual modo de atualização uma tabela dinâmica existente usa, consulte Modo de atualização.

Importante

As tabelas dinâmicas no modo de atualização incremental só podem ser downstream das tabelas dinâmicas com modo de atualização completa se a tabela de atualização completa upstream tem uma chave exclusiva derivada do sistema ou uma restrição de imutabilidade.

Para obter mais informações, consulte Explicando as chaves primárias em tabelas dinâmicas e Explicando as restrições de imutabilidade.

Como os dados são atualizados quando uma tabela dinâmica depende de outras tabelas dinâmicas¶

Quando o atraso de uma tabela dinâmica é definido como uma medida de tempo, o processo de atualização automatizado programa as atualizações para melhor atender aos tempos de atraso de destino.

Para manter os dados consistentes nos casos em que uma tabela dinâmica depende de outra, o processo atualiza todas as tabelas dinâmicas em uma conta em horários compatíveis. O momento das atualizações menos frequentes coincide com o momento das atualizações mais frequentes. Se as atualizações demorarem muito, o agendador poderá ignorar as atualizações para tentar se manter atualizado. No entanto, o isolamento do instantâneo é preservado.

Por exemplo, suponha que a tabela dinâmica DT1 tenha um atraso de destino de dois minutos e consulte a tabela dinâmica DT2, que tem um atraso de destino de um minuto. O processo pode determinar que DT1 deve ser atualizada a cada 96 segundos e DT2 a cada 48 segundos. Como resultado, o processo pode aplicar o seguinte cronograma:


Ponto específico no tempo	Tabelas dinâmicas atualizadas
2022-12-01 00:00:00	DT1, DT2
2022-12-01 00:00:48	DT2
2022-12-01 00:01:36	DT1, DT2
2022-12-01 00:02:24	DT2

A meta de atraso de uma tabela dinâmica não pode ser menor que a meta de atraso das tabelas dinâmicas das quais ela depende, a menos que a tabela dinâmica upstream seja referenciada por DYNAMIC_TABLE_REFRESH_BOUNDARY(). Por exemplo, suponha que você especifique o seguinte:

DT1 consulta as tabelas dinâmicas DT2 e DT3.
DT2 tem um atraso de destino de cinco minutos.
DT3 tem um atraso de destino de um minuto.

Isso significa que o tempo de atraso de destino para DT1 não deve ser inferior a cinco minutos (ou seja, não deve ser inferior ao maior dos tempos de atraso para DT2 e DT3).

Se você definir o atraso para DT1 para cinco minutos, o processo define um cronograma de atualização com essas metas:

Atualize a DT3 com frequência suficiente para manter o atraso abaixo de um minuto.
Atualize DT1 e DT2 juntas e com frequência suficiente para manter seus atrasos abaixo de cinco minutos.
Certifique-se de que a atualização de DT1 e DT2 coincida com uma atualização de DT3 para garantir o isolamento do instantâneo.

Importante

Para obter mais informações, consulte Explicando as chaves primárias em tabelas dinâmicas e Explicando as restrições de imutabilidade.

Isolamento de instantâneo¶

Quando uma tabela dinâmica é atualizada, ela garante um estado consistente aplicando o Time Travel para o mesmo carimbo de data/hora em todas as dependências upstream.

Para tabelas de base não dinâmicas, o Time Travel funciona como de costume, observando o horário de confirmação do relógio. Isso significa que o conteúdo de uma tabela dinâmica é sempre consistente com um “instantâneo” dos dados nas tabelas base.

Para tabelas dinâmicas upstream, o Snowflake consulta a versão de tabela específica marcada com esse carimbo de data/hora. Isso garante que as tabelas downstream sejam sempre consistentes com as predecessoras. Você não precisa coordenar cronogramas de atualização ou se preocupar com diferentes atrasos; o Snowflake alinha automaticamente os instantâneos para garantir a integridade dos dados em todo o pipeline.

O isolamento de instantâneo não é garantido nos seguintes casos:

Instruções SELECT manuais: quando você une várias tabelas dinâmicas usando uma instrução SELECT manual, as consultas ad hoc usam a versão atual de cada tabela. Como cada tabela dinâmica confirma a atualização de forma independente, uma junção manual pode capturar diferentes estados de atualização, mesmo que as tabelas dinâmicas compartilhem o mesmo atraso de destino ou que uma atualização upstream esteja atrasada. Isso significa que talvez os resultados não reflitam um instantâneo único e consistente dos dados base.
Limites de atualização: quando uma tabela dinâmica faz referência a uma tabela dinâmica upstream por meio de DYNAMIC_TABLE_REFRESH_BOUNDARY(), a tabela dinâmica upstream é tratada como pertencente a um pipeline separado. A tabela dinâmica downstream lê qualquer versão dos dados upstream que esteja disponível no momento da atualização, em vez de um carimbo de data/hora coordenado de dados.

Como compreender os efeitos das alterações nas colunas das tabelas de base¶

Quando os objetos subjacentes associados a uma tabela dinâmica mudam, os seguintes comportamentos se aplicam:


Mudança	Impacto
Nova coluna adicionada à tabela base. Coluna existente não utilizada removida na tabela base.	Nenhum. Se uma nova coluna for adicionada à tabela de base ou uma coluna não utilizada for excluída, nenhuma ação ocorrerá e as atualizações continuarão como antes.
A tabela de base subjacente é recriada com nomes e tipos de coluna idênticos. A coluna da tabela de base subjacente é recriada com o mesmo nome e tipo. Alterações nas políticas em tabelas base subjacentes de tabelas dinâmicas com atualização incremental.	Reinicialização: a primeira atualização após a recriação é a inicialização.
Alterações na tabela base subjacente para tabelas dinâmicas criadas com `SELECT *` a partir da tabela base.	A tabela dinâmica falha ao atualizar e deve ser recriada para responder à alteração.
Alterações na tabela de base subjacente para tabelas dinâmicas criadas com uma definição de coluna.	Sem impacto na tabela dinâmica.