Améliorations des performances - 2024¶
Important
Les améliorations de performance visent souvent des modèles de requêtes ou des charges de travail spécifiques. Ces améliorations peuvent ou non avoir un impact matériel sur une charge de travail spécifique.
Les améliorations de performance suivantes ont été introduites en 2024.
Sortie |
Description |
Impact |
---|---|---|
Octobre 2024 |
Amélioration de la réplication des métadonnées. |
Réduit le temps passé dans les phases SECONDARY_UPLOADING_INVENTORY, PRIMARY_UPLOADING_METADATA, et SECONDARY_DOWNLOADING_METADATA d’une actualisation de réplication en optimisant l’allocation de calcul sans serveur. Cette amélioration cible les actualisations avec des tailles de métadonnées plus grandes. |
Septembre 2024 |
Améliorations des opérations de clonage grâce à la parallélisation. |
Réduit le temps nécessaire au clonage des objets, en particulier pour les bases de données et les schémas contenant des métadonnées étendues. |
Septembre 2024 |
Amélioration des actualisations de réplication grâce à la parallélisation. |
Réduit le temps d’actualisation global lors de la réplication de grands volumes de données. |
Août 2024 |
Amélioration des performances pour les requêtes LIMIT. |
Réduit le temps de compilation et d’exécution des requêtes qui utilisent une clause LIMIT pour renvoyer |
Juillet 2024 |
Amélioration de la synchronisation des colonnes de table pour la réplication. |
Réduit le temps passé dans la phase SECONDARY_DOWNLOADING_METADATA d’une opération d’actualisation. |
Juillet 2024 |
Amélioration de l’utilisation de l’entrepôt pour les requêtes qui analysent uniquement une petite quantité de micro-partitions par rapport aux ressources de calcul disponibles pour l’entrepôt virtuel. |
Exécution plus rapide pour les requêtes avec des opérations coûteuses lors de l’analyse des données à partir d’un petit nombre de micro-partitions, ce qui est courant dans les cas d’utilisation de BI et de tableau de bord. |
Juillet 2024 |
Amélioration du traitement des requêtes qui :
|
Exécution plus rapide pour certaines requêtes avec des clauses LIMIT des instructions GROUP BY. |
Juin 2024 |
Amélioration du traitement single instruction, multiple data (SIMD). |
|
Mai 2024 |
Amélioration de l’efficacité du clustering automatique. |
Réduit le coût du clustering automatique, car il fonctionne plus efficacement. |
Mai 2024 |
Amélioration de la réplication des objets. |
Réduit le temps passé dans les phases SECONDARY_UPLOADING_INVENTORY et SECONDARY_DOWNLOADING_METADATA d’une opération d’actualisation en optimisant la synchronisation de certains objets et le mécanisme d’autorisation pour les opérations de réplication. |
Mai 2024 |
Réduction du temps de latence pour le chargement de la plupart des fichiers Parquet jusqu’à 50 % lorsque l’option de format de fichier, USE_VECTORIZED_SCANNER, est réglée sur |
Le scanner vectorisé est bien adapté au format en colonnes d’un fichier Parquet et réduit la latence d’ingestion en ne téléchargeant en mémoire que les sections pertinentes du fichier Parquet, telles que le sous-ensemble de colonnes sélectionnées. |
Mai 2024 |
Amélioration de l’évaluation des agrégations afin qu’elles soient effectuées à un plus grand nombre d’arbres de jointure intermédiaires. |
Réduit le temps d’exécution des requêtes pour les requêtes complexes avec agrégations en réduisant la quantité de données à traiter le plus tôt possible. |
Mai 2024 |
Amélioration des délais d’exécution des requêtes pour les requêtes qui passent beaucoup de temps à communiquer entre les nœuds de l’entrepôt virtuel. |
Augmente le débit entre les ressources de calcul d’un entrepôt. Chaque entrepôt est un cluster de ressources de calcul. |
Mai 2024 |
Amélioration du nettoyage top-k pour les requêtes LIMIT et ORDER BY. |
Réduit le temps d’exécution des requêtes top-k en raison de la diminution du nombre de fichiers analysés et de la lecture des en-têtes de fichiers. Étend les améliorations top-k existantes pour inclure la prise en charge de STRING/BINARY dans les colonnes ORDER BY. Augmente encore l’efficacité du nettoyage en triant l’ensemble d’analyse par ordre des fichiers les plus grands/les plus petits par rapport au domaine de valeurs. |
Mai 2024 |
Amélioration des décisions relatives à l’ordre de jointure en calculant les estimations de sélectivité avec une plus grande granularité. |
Réduit le temps de compilation et d’exécution des requêtes en calculant les estimations de sélectivité au niveau des micro-partitions. |
Mai 2024 |
Temps de chargement plus rapide pour Python. |
Améliore les performances des applis Streamlit in Snowflake (y compris les applis Streamlit au sein d’une Snowflake Native App), des feuilles de calcul Python, d’UDFs Python, et de procédures stockées en Python. |
Avril 2024 |
Réduction de la contention des verrouillages et des mutex. |
Réduit les temps d’exécution des requêtes en améliorant les performances de balayage dans divers scénarios tels que les requêtes hautement concurrentes exécutées sur un entrepôt. |
Avril 2024 |
Amélioration des décisions de jointure de diffusion. |
Réduit le temps d’exécution des requêtes et améliore la gestion de la mémoire en optimisant les jointures de diffusion dans des scénarios tels que les arbres de jointure profonds à droite. |
Avril 2024 |
Les résultats des requêtes sont plus rapides dans Snowsight. |
Réduit le temps d’affichage des résultats de la requête lorsqu’elle est exécutée dans Snowsight. Les améliorations sont les plus notables pour les requêtes qui renvoient des jeux de résultats de plus de 10 000 lignes. |
Mars 2024 |
Amélioration de la réplication des métadonnées. |
Réduit le temps passé dans les phases PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA et SECONDARY_UPLOADING_INVENTORY pour les métadonnées. |
Mars 2024 |
Amélioration des performances des requêtes grâce à un calcul plus précis des estimations de sélectivité afin d’optimiser l’ordre des jointures. |
Réduit le temps d’exécution en cas de non-concordance entre les métadonnées de la partition et la cardinalité réelle des filtres de jointure. |
Mars 2024 |
Amélioration des performances pour le chargement des fichiers JSON. |
Il en résulte une réduction de la latence d’ingestion pouvant aller jusqu’à 25 % pour de nombreux scénarios de chargement JSON. |
Février 2024 |
Amélioration de la réplication des objets. |
Réduit le temps passé dans les phases PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA et SECONDARY_UPLOADING_INVENTORY d’une opération d’actualisation en optimisant certaines parties de l’opération d’instantané et la manière dont certains objets sont ajoutés à l’inventaire de réplication. |
Février 2024 |
La prise en charge des spécifications de classement |
Possibilité de définir les spécifications de classement |
Janvier 2024 |
Amélioration du temps d’exécution des requêtes LIMIT 0. |
Réduit le temps d’exécution des requêtes qui utilisent un comptage de |
Janvier 2024 |
Disponibilité générale des entrepôts plus grands (5X-LARGE et 6X-LARGE) dans les régions Microsoft Azure, à l’exclusion des régions Azure Government. |
Possibilité d’utiliser des ressources de calcul plus importantes pour les requêtes qui mobilisent plus de mémoire par rapport aux entrepôts plus petits. |