Améliorations des performances - 2024¶

Important

Les améliorations de performance visent souvent des modèles de requêtes ou des charges de travail spécifiques. Ces améliorations peuvent ou non avoir un impact matériel sur une charge de travail spécifique.

The following performance improvements were introduced in 2024:


Sortie	Description	Impact
Décembre 2024	Amélioration du partage des parties communes ou similaires d’une requête.	Réduit le temps d’exécution des requêtes comportant plusieurs clauses WITH.
Décembre 2024	Improved scaling of document pre-processing and inference in Document AI.	Diminue le temps de traitement des documents.
Novembre 2024	Élagage Top-K pour les requêtes contenant des fonctions agrégées.	Étend l’élagage Top-K pour inclure les requêtes contenant des fonctions agrégées.
Octobre 2024	Amélioration des performances des requêtes comportant des sous-requêtes ou des sous-expressions équivalentes (ou similaires).	Réduit le temps d’exécution des requêtes en éliminant les parties en double d’un plan de requête.
Octobre 2024	Amélioration de la gestion de l’asymétrie.	Réduit le temps d’exécution des requêtes en détectant et en résolvant automatiquement l’asymétrie du côté de la construction des jointures.
Octobre 2024	Mise à jour de l’optimisation de la recherche : prise en charge des requêtes de jointure. (Disponibilité générale)	Améliore les performances des requêtes de jointure qui comportent un petit nombre de valeurs distinctes du côté de la construction de la jointure.
Octobre 2024	Amélioration de la réplication des métadonnées.	Réduit le temps passé dans les phases SECONDARY_UPLOADING_INVENTORY, PRIMARY_UPLOADING_METADATA, et SECONDARY_DOWNLOADING_METADATA d’une actualisation de réplication en optimisant l’allocation de calcul sans serveur. Cette amélioration cible les actualisations avec des tailles de métadonnées plus grandes.
Septembre 2024	Améliorations des opérations de clonage grâce à la parallélisation.	Réduit le temps nécessaire au clonage des objets, en particulier pour les bases de données et les schémas contenant des métadonnées étendues.
Septembre 2024	Amélioration des actualisations de réplication grâce à la parallélisation.	Réduit le temps d’actualisation global lors de la réplication de grands volumes de données.
Août 2024	Amélioration des performances pour les requêtes LIMIT.	Réduit le temps de compilation et d’exécution des requêtes qui utilisent une clause LIMIT pour renvoyer `n` lignes d’une table. Cette optimisation réduit les partitions analysées pour couvrir uniquement les `n` premières lignes.
Juillet 2024	Amélioration de la synchronisation des colonnes de table pour la réplication.	Réduit le temps passé dans la phase SECONDARY_DOWNLOADING_METADATA d’une opération d’actualisation.
Juillet 2024	Amélioration de l’utilisation de l’entrepôt pour les requêtes qui analysent uniquement une petite quantité de micro-partitions par rapport aux ressources de calcul disponibles pour l’entrepôt virtuel.	Exécution plus rapide pour les requêtes avec des opérations coûteuses lors de l’analyse des données à partir d’un petit nombre de micro-partitions, ce qui est courant dans les cas d’utilisation de BI et de tableau de bord.
Juillet 2024	Amélioration du traitement des requêtes qui : Transfère les clauses LIMIT vers les nœuds d’agrégation qui ne contiennent aucune agrégation autre que la fonction ANY_VALUE. Élimine les clés de regroupement redondantes lorsque les contraintes PRIMARY KEY ou UNIQUE sont appliquées par validation ou lorsque la propriété RELY de contrainte est utilisée.	Exécution plus rapide pour certaines requêtes avec des clauses LIMIT des instructions GROUP BY.
Juin 2024	Amélioration du traitement single instruction, multiple data (SIMD).	Réduit le temps d’exécution des requêtes et améliore les performances d’analyse pour les requêtes qui accèdent aux colonnes contenant des valeurs NULL. Offre de meilleures performances d’analyse en décodant les nombres plus efficacement lors de la lecture de données à partir d’un stockage distant.
Mai 2024	Amélioration de l’efficacité du clustering automatique.	Réduit le coût du clustering automatique, car il fonctionne plus efficacement.
Mai 2024	Amélioration de la réplication des objets.	Réduit le temps passé dans les phases SECONDARY_UPLOADING_INVENTORY et SECONDARY_DOWNLOADING_METADATA d’une opération d’actualisation en optimisant la synchronisation de certains objets et le mécanisme d’autorisation pour les opérations de réplication.
Mai 2024	Réduction du temps de latence pour le chargement de la plupart des fichiers Parquet jusqu’à 50 % lorsque l’option de format de fichier, USE_VECTORIZED_SCANNER, est réglée sur `TRUE`.	Le scanner vectorisé est bien adapté au format en colonnes d’un fichier Parquet et réduit la latence d’ingestion en ne téléchargeant en mémoire que les sections pertinentes du fichier Parquet, telles que le sous-ensemble de colonnes sélectionnées.
Mai 2024	Amélioration de l’évaluation des agrégations afin qu’elles soient effectuées à un plus grand nombre d’arbres de jointure intermédiaires.	Réduit le temps d’exécution des requêtes pour les requêtes complexes avec agrégations en réduisant la quantité de données à traiter le plus tôt possible.
Mai 2024	Amélioration des délais d’exécution des requêtes pour les requêtes qui passent beaucoup de temps à communiquer entre les nœuds de l’entrepôt virtuel.	Augmente le débit entre les ressources de calcul d’un entrepôt. Chaque entrepôt est un cluster de ressources de calcul.
Mai 2024	Amélioration du nettoyage top-k pour les requêtes LIMIT et ORDER BY.	Réduit le temps d’exécution des requêtes top-k en raison de la diminution du nombre de fichiers analysés et de la lecture des en-têtes de fichiers. Étend les améliorations top-k existantes pour inclure la prise en charge de STRING/BINARY dans les colonnes ORDER BY. Augmente encore l’efficacité du nettoyage en triant l’ensemble d’analyse par ordre des fichiers les plus grands/les plus petits par rapport au domaine de valeurs.
Mai 2024	Amélioration des décisions relatives à l’ordre de jointure en calculant les estimations de sélectivité avec une plus grande granularité.	Réduit le temps de compilation et d’exécution des requêtes en calculant les estimations de sélectivité au niveau des micro-partitions.
Mai 2024	Temps de chargement plus rapide pour Python.	Améliore les performances des applis Streamlit in Snowflake (y compris les applis Streamlit au sein d’une Snowflake Native App), des feuilles de calcul Python, d’UDFs Python, et de procédures stockées en Python.
Avril 2024	Réduction de la contention des verrouillages et des mutex.	Réduit les temps d’exécution des requêtes en améliorant les performances de balayage dans divers scénarios tels que les requêtes hautement concurrentes exécutées sur un entrepôt.
Avril 2024	Amélioration des décisions de jointure de diffusion.	Réduit le temps d’exécution des requêtes et améliore la gestion de la mémoire en optimisant les jointures de diffusion dans des scénarios tels que les arbres de jointure profonds à droite.
Avril 2024	Les résultats des requêtes sont plus rapides dans Snowsight.	Réduit le temps d’affichage des résultats de la requête lorsqu’elle est exécutée dans Snowsight. Les améliorations sont les plus notables pour les requêtes qui renvoient des jeux de résultats de plus de 10 000 lignes.
Mars 2024	Amélioration de la réplication des métadonnées.	Réduit le temps passé dans les phases PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA et SECONDARY_UPLOADING_INVENTORY pour les métadonnées.
Mars 2024	Amélioration des performances des requêtes grâce à un calcul plus précis des estimations de sélectivité afin d’optimiser l’ordre des jointures.	Réduit le temps d’exécution en cas de non-concordance entre les métadonnées de la partition et la cardinalité réelle des filtres de jointure.
Mars 2024	Amélioration des performances pour le chargement des fichiers JSON.	Il en résulte une réduction de la latence d’ingestion pouvant aller jusqu’à 25 % pour de nombreux scénarios de chargement JSON.
Février 2024	Amélioration de la réplication des objets.	Réduit le temps passé dans les phases PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA et SECONDARY_UPLOADING_INVENTORY d’une opération d’actualisation en optimisant certaines parties de l’opération d’instantané et la manière dont certains objets sont ajoutés à l’inventaire de réplication.
Février 2024	La prise en charge des spécifications de classement `upper` et `lower` a été ajoutée à certaines fonctions.	Possibilité de définir les spécifications de classement `upper` et `lower` pour certaines fonctions. Les spécifications de classement `upper` et `lower` sont plus performantes que la spécification `ci` dans certains cas d’utilisation. Les spécifications de classement `upper` et `lower` sont désormais prises en charge pour les fonctions suivantes : CHARINDEX, CONTAINS, ENDSWITH, POSITION, SPLIT, SPLIT_PART, et STARTSWITH. Pour plus d’informations, voir Différences entre ci et upper / lower.
Janvier 2024	Amélioration du temps d’exécution des requêtes LIMIT 0.	Réduit le temps d’exécution des requêtes qui utilisent un comptage de `0` avec LIMIT, qui est souvent utilisé par les applications pour renvoyer les en-têtes de colonnes et les types de données pour les résultats de la requête.
Janvier 2024	Disponibilité générale des entrepôts plus grands (5X-LARGE et 6X-LARGE) dans les régions Microsoft Azure, à l’exclusion des régions Azure Government.	Possibilité d’utiliser des ressources de calcul plus importantes pour les requêtes qui mobilisent plus de mémoire par rapport aux entrepôts plus petits.