Leistungsverbesserungen 2024¶
Wichtig
Leistungsverbesserungen zielen oft auf bestimmte Abfragemuster oder Workloads ab. Diese Verbesserungen können erhebliche Auswirkungen auf einen bestimmten Workload haben, müssen es aber nicht.
Die folgenden Leistungsverbesserungen wurden 2024 eingeführt.
Release |
Beschreibung |
Auswirkung |
---|---|---|
Oktober 2024 |
Verbesserte Replikation von Metadaten. |
Reduziert die Zeit, die in den Phasen SECONDARY_UPLOADING_INVENTORY, PRIMARY_UPLOADING_METADATA und SECONDARY_DOWNLOADING_METADATA einer Replikationsaktualisierung verbracht wird, indem die serverlose Rechenzuweisung optimiert wird. Diese Verbesserung zielt auf Aktualisierungen mit größeren Metadaten ab. |
September 2024 |
Verbesserte Operationen zum Klonen durch Parallelisierung. |
Verringert den Zeitaufwand für das Klonen von Objekten, insbesondere für Datenbanken und Schemas mit umfangreichen Metadaten. |
September 2024 |
Verbesserte Aktualisierungen der Replikation durch Parallelisierung. |
Verkürzt die gesamte Aktualisierungszeit bei der Replikation von großen Datenmengen. |
August 2024 |
Verbesserte Leistung für LIMIT-Abfragen. |
Verkürzt die Kompilierungs- und Ausführungszeit für Abfragen, die eine LIMIT-Klausel verwenden, um |
Juli 2024 |
Verbesserte Synchronisierung von Tabellenspalten für die Replikation. |
Verkürzt die Zeit, die in der SECONDARY_DOWNLOADING_METADATA-Phase einer Aktualisierungsoperation verbracht wird. |
Juli 2024 |
Bessere Auslastung des Warehouse bei Abfragen, die nur eine geringe Anzahl von Mikropartitionen durchsuchen, im Vergleich zu den Computeressourcen, die dem virtuellen Warehouse zur Verfügung stehen. |
Schnellere Ausführung von Abfragen mit kostspieligen Operationen beim Scannen von Daten aus einer kleinen Anzahl von Mikropartitionen, wie sie in BI- und Dashboard-Anwendungsfällen üblich sind. |
Juli 2024 |
Verbesserte Verarbeitung von Abfragen:
|
Schnellere Ausführung einiger Abfragen mit LIMIT-Klauseln und GROUP BY-Anweisungen. |
Juni 2024 |
Verbesserte Verarbeitung von einzelnen Anweisungen mit mehreren Daten (SIMD). |
|
Mai 2024 |
Verbesserte Effizienz von Automatic Clustering. |
Reduziert die Kosten für Automatic Clustering, da es effizienter arbeitet. |
Mai 2024 |
Verbesserte Objektreplikation. |
Reduziert die Zeit, die in den Phasen SECONDARY_UPLOADING_INVENTORY und SECONDARY_DOWNLOADING_METADATA einer Aktualisierungsoperation verbracht wird, indem die Synchronisierung einiger Objekte und der Autorisierungsmechanismus für Replikationsoperationen optimiert wurden. |
Mai 2024 |
Reduzierte Latenz beim Laden der meisten Parquet-Dateien wurde um bis zu 50 %, wenn Dateiformatoption USE_VECTORIZED_SCANNER auf |
Der vektorisierte Scanner eignet sich gut für das spaltenweise Format einer Parquet-Datei und reduziert die Datenaufnahmelatenz, indem nur relevante Abschnitte der Parquet-Datei in den Arbeitsspeicher heruntergeladen werden, z. B. die Teilmenge der ausgewählten Spalten. |
Mai 2024 |
Verbesserte Evaluation von Aggregationen, die an mehr mittleren Join-Bäumen erfolgen. |
Die Ausführungszeit von komplexen Abfragen mit Aggregationen wurde reduziert, indem die zu verarbeitende Datenmenge zum frühestmöglichen Zeitpunkt reduziert wird. |
Mai 2024 |
Verbesserte Ausführungszeiten von Abfragen, die viel Zeit für die Kommunikation zwischen virtuellen Warehouse-Knoten verbrauchen. |
Erhöht den Durchsatz zwischen Computeressourcen in einem Warehouse. Jedes virtuelle Warehouse ist ein Cluster von Computeressourcen. |
Mai 2024 |
Verbessertes Top-k-Pruning bei LIMIT- und ORDER BY-Abfragen. |
Reduziert die Ausführungszeit von Top-k-Abfragen, da weniger Dateien gescannt und Dateiheader gelesen werden. Erweitert die bestehenden Top-k-Verbesserungen um die Unterstützung von STRING und BINARY in ORDER BY-Spalten. Erhöht die Pruning-Effizienz weiter, indem der Scan-Satz in der Reihenfolge der größten/kleinsten Dateien in Bezug zum Wertebereich sortiert wird. |
Mai 2024 |
Verbesserte Entscheidungen zur Join-Reihenfolge durch Berechnung von Selektivitätsschätzungen mit größerer Granularität. |
Reduziert die Kompilierungs- und Abfrageausführungszeit durch die Berechnung von Selektivitätsschätzungen auf Mikropartitionsebene. |
Mai 2024 |
Schnelleres Laden von Python. |
Verbessert die Leistung von Streamlit in Snowflake-Apps (einschließlich Streamlit-Apps innerhalb einer Snowflake Native App), Python-Arbeitsblättern, Python-UDFs und gespeicherten Prozeduren in Python. |
April 2024 |
Reduzierte Begrenzung von lock/mutex. |
Reduziert die Ausführungszeiten von Abfragen durch verbesserte Scan-Leistung in Vielzahl von Szenarios, z. B. bei hochgradig parallelen Abfragen in einem Warehouse. |
April 2024 |
Verbesserte Entscheidungen bei Broadcast-Joins. |
Reduziert Ausführungszeit von Abfragen und verbessert Arbeitsspeicherverwaltung durch Optimierung von Broadcast-Joins in Szenarios wie rechts-tiefen Join-Bäumen. |
April 2024 |
Schnellere Abfrageergebnisse in Snowsight. |
Verringert die Zeit bis zur Anzeige der Abfrageergebnisse bei Ausführung in Snowsight. Verbesserungen sind vor allem bei Abfragen bemerkbar, die Resultsets mit mehr als 10.000 Zeilen zurückgeben. |
März 2024 |
Verbesserte Replikation von Metadaten. |
Reduziert die Zeit, die in den Phasen PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA und SECONDARY_UPLOADING_INVENTORY für Metadaten verbracht wird. |
März 2024 |
Verbesserte Abfrageleistung durch genauere Berechnung von Selektivitätsschätzungen zur Optimierung der Reihenfolge von Joins. |
Verringert die Ausführungszeit, wenn die Metadaten der Partition und die tatsächliche Kardinalität der Join-Filter nicht übereinstimmen. |
März 2024 |
Verbesserte Leistung beim Laden von JSON-Dateien. |
Führt zu einer um bis zu 25 % geringeren Datenaufnahmelatenz in vielen JSON-Ladeszenarios. |
Februar 2024 |
Verbesserte Objektreplikation. |
Reduziert die Zeit, die in den Phasen PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA und SECONDARY_UPLOADING_INVENTORY einer Aktualisierungsoperation verbracht wird, indem Teile der Snapshot-Operation und die Vorgehensweise beim Hinzufügen einiger Objekte zum Replikationsbestand optimiert werden. |
Februar 2024 |
Unterstützung der Sortierungsspezifikationen |
Möglichkeit, die Sortierungsspezifikationen |
Januar 2024 |
Verbesserte Ausführungszeit für LIMIT 0-Abfragen. |
Reduziert die Ausführungszeit von Abfragen, die eine Anzahl von |
Januar 2024 |
Allgemeine Verfügbarkeit von größeren Warehouses (5X-LARGE und 6X-LARGE) in Microsoft Azure-Regionen, ausgenommen Azure Government-Regionen. |
Möglichkeit der Nutzung größerer Computeressourcen für Abfragen mit hohem Arbeitsspeicherbedarf anstelle von kleineren Warehouses. |