Melhoria de desempenho de 2024

Importante

As melhorias de desempenho geralmente visam padrões de consulta ou cargas de trabalho específicas. Essas melhorias podem ou não ter um impacto material em uma carga de trabalho específica.

As seguintes melhorias de desempenho foram introduzidas em 2024.

Lançado

Descrição

Impacto

Outubro de 2024

Replicação de metadados aprimorada.

Reduz o tempo gasto nas fases SECONDARY_UPLOADING_INVENTORY, PRIMARY_UPLOADING_METADATA e SECONDARY_DOWNLOADING_METADATA de uma atualização de replicação otimizando a alocação de computação sem servidor. Essa melhoria visa atualizações com tamanhos maiores de metadados.

Setembro de 2024

Operações de clonagem aprimoradas por meio de paralelização.

Reduz o tempo necessário para clonar objetos, especialmente para bancos de dados e esquemas com metadados extensos.

Setembro de 2024

Atualizações de replicação aprimoradas por meio de paralelização.

Reduz o tempo geral de atualização ao replicar grandes volumes de dados.

Agosto de 2024

Desempenho aprimorado para consultas LIMIT.

Reduz o tempo de compilação e execução de consultas que usam uma cláusula LIMIT para retornar n linhas de uma tabela. Essa otimização reduz as partições que são verificadas para cobrir apenas as primeiras n linhas.

Julho de 2024

Sincronização de colunas de tabela aprimorada para replicação.

Reduz o tempo gasto na fase SECONDARY_DOWNLOADING_METADATA de uma operação de atualização.

Julho de 2024

Utilização aprimorada do warehouse para consultas que examinam apenas uma pequena quantidade de micropartições quando comparado aos recursos de computação disponíveis para o warehouse virtual.

Execução mais rápida para consultas com operações caras ao escanear dados de um pequeno número de micropartições, o que é comum em BI e casos de uso de painel.

Julho de 2024

Processamento de consulta aprimorado que:

  • Envia cláusulas LIMIT para nós de agregação que não contêm nenhuma agregação além da função ANY_VALUE.

  • Elimina chaves de agrupamento redundantes quando restrições PRIMARY KEY ou UNIQUE são impostas pela validação ou quando a propriedade de restrição RELY é usada.

Execução mais rápida para algumas consultas com cláusulas LIMIT e instruções GROUP BY.

Junho de 2024

Melhoria no processamento de instrução única, vários dados (SIMD).

  • Reduz o tempo de execução da consulta e melhora o desempenho da verificação para consultas que acessam colunas com valores NULL.

  • Oferece melhor desempenho de digitalização decodificando números de forma mais eficiente ao ler dados de armazenamento remoto.

Maio de 2024

Eficiência aprimorada do Clustering automático.

Reduz o custo do Clustering automático porque ele funciona de forma mais eficiente.

Maio de 2024

Replicação de objetos aprimorada.

Reduz o tempo gasto nas fases SECONDARY_UPLOADING_INVENTORY e SECONDARY_DOWNLOADING_METADATA de uma operação de atualização, otimizando a sincronização de alguns objetos e o mecanismo de autorização para operações de replicação.

Maio de 2024

Reduzida a latência para carregar a maioria dos arquivos Parquet em até 50% quando a opção de formato de arquivo, USE_VECTORIZED_SCANNER, está definida como TRUE.

O scanner vetorizado é bem adequado para o formato colunar de um arquivo Parquet e reduz a latência de ingestão baixando apenas seções relevantes do arquivo Parquet na memória, como o subconjunto de colunas selecionadas.

Maio de 2024

Avaliação aprimorada de agregações para que sejam feitas em árvores de junção mais intermediárias.

Reduz o tempo de execução de consultas complexas com agregações, reduzindo a quantidade de dados que precisam ser processados o mais cedo possível.

Maio de 2024

Tempos de execução de consulta aprimorados para consultas que gastam uma quantidade significativa de tempo se comunicando entre nós de warehouse virtual.

Aumenta o rendimento entre recursos de computação em um warehouse. Cada warehouse é um cluster de recursos computacionais.

Maio de 2024

Melhoria na remoção top-k para consultas LIMIT e ORDER BY.

Reduz o tempo de execução para consultas top-k devido a menos arquivos varridos e leituras de cabeçalhos de arquivo. Expande as melhorias top-k existentes para incluir o suporte de STRING/BINARY em colunas ORDER BY. Aumenta ainda mais a eficiência da remoção ao classificar o conjunto de varredura em ordem de arquivos maiores/menores em relação ao domínio de valor.

Maio de 2024

Decisões de ordem de junção aprimoradas por meio do cálculo de estimativas de seletividade com mais granularidade.

Reduz o tempo de compilação e o tempo de execução da consulta calculando estimativas de seletividade no nível da micropartição.

Maio de 2024

Tempo de carregamento mais rápido para Python.

Melhora o desempenho para aplicativos Streamlit in Snowflake (incluindo aplicativos Streamlit dentro de um Snowflake Native App), planilhas Python, UDFs de Python e procedimentos armazenados em Python.

Abril de 2024

Contenção de bloqueio/mútua reduzida.

Reduz os tempos de execução de consultas melhorando o desempenho da verificação em diversos cenários, como consultas altamente simultâneas em execução em um warehouse.

Abril de 2024

Decisões de junção de transmissão aprimoradas.

Reduz o tempo de execução da consulta e melhora o gerenciamento de memória otimizando junções de transmissão em cenários como árvores de junção profundas.

Abril de 2024

Resultados de consulta mais rápidos em Snowsight.

Reduz o tempo que leva para os resultados da consulta aparecerem quando executados em Snowsight. As melhorias são mais perceptíveis em consultas que retornam conjuntos de resultados maiores que 10.000 linhas.

Março de 2024

Replicação de metadados aprimorada.

Reduz o tempo gasto nas fases PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA e SECONDARY_UPLOADING_INVENTORY para metadados.

Março de 2024

Desempenho de consulta aprimorado como resultado do cálculo mais preciso de estimativas de seletividade para otimizar a ordem das junções.

Reduz o tempo de execução quando há incompatibilidades entre os metadados da partição e a cardinalidade real dos filtros de junção.

Março de 2024

Desempenho aprimorado para carregamento de arquivos JSON.

Resulta em menor latência de ingestão de até 25% para muitos cenários de carregamento de JSON.

Fevereiro de 2024

Replicação de objetos aprimorada.

Reduz o tempo gasto nas fases PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA e SECONDARY_UPLOADING_INVENTORY de uma operação de atualização otimizando partes da operação de instantâneo e a maneira como alguns objetos são adicionados ao inventário de replicação.

Fevereiro de 2024

Suporte para as especificações de agrupamento upper e lower adicionadas a algumas funções.

Capacidade de definir as especificações de agrupamento upper e lower para algumas funções. As especificações de agrupamento upper e lower apresentam desempenho melhor que a especificação ci em alguns casos de uso. As especificações de agrupamento upper e lower agora são suportadas para as seguintes funções: CHARINDEX, CONTAINS, ENDSWITH, POSITION, SPLIT, SPLIT_PART e STARTSWITH. Para obter mais informações, consulte Diferenças entre ci e upper / lower.

Janeiro de 2024

Tempo de execução aprimorado para consultas LIMIT 0.

Reduz o tempo de execução para consultas que usam uma contagem de 0 com LIMIT, que é frequentemente usada por aplicativos para retornar títulos de colunas e tipos de dados para resultados de consultas.

Janeiro de 2024

Disponibilidade geral de warehouses maiores (5X-LARGE e 6X-LARGE) nas regiões do Microsoft Azure, excluindo regiões governamentais do Azure.

Capacidade de usar recursos de computação maiores para consultas com uso intensivo de memória em comparação com warehouses menores.