Leistungsverbesserungen 2024¶

Wichtig

Leistungsverbesserungen zielen oft auf bestimmte Abfragemuster oder Workloads ab. Diese Verbesserungen können erhebliche Auswirkungen auf einen bestimmten Workload haben, müssen es aber nicht.

The following performance improvements were introduced in 2024:


Release	Beschreibung	Auswirkung
Dezember 2024	Verbessertes Freigeben von gemeinsamen oder ähnlichen Teilen einer Abfrage.	Reduziert die Ausführungszeit für Abfragen mit mehreren WITH-Klauseln.
Dezember 2024	Improved scaling of document pre-processing and inference in Document AI.	Verringert die Bearbeitungszeit von Dokumenten.
November 2024	Top-K Pruning für Abfragen, die Aggregationsfunktionen enthalten.	Erweitert Top-k Pruning auf Abfragen, die Aggregationsfunktionen enthalten.
Oktober 2024	Verbesserte Leistung für Abfragen, die gleichwertige (oder ähnliche) Unterabfragen oder Unterausdrücke haben.	Reduziert die Ausführungszeit von Abfragen, indem doppelte Teile eines Abfrageplans eliminiert werden.
Oktober 2024	Verbesserte Handhabung von Schiefe.	Reduziert die Ausführungszeit von Abfragen durch automatische Erkennung und Behebung von Schieflagen auf der Build-Seite von Joins.
Oktober 2024	Aktualisierung der Suchoptimierung: Unterstützung von Join-Abfragen. (Allgemeine Verfügbarkeit)	Verbessert die Leistung von Abfragen, die eine geringe Anzahl unterschiedlicher Werte auf der Build-Seite der Verknüpfung haben.
Oktober 2024	Verbesserte Replikation von Metadaten.	Reduziert die Zeit, die in den Phasen SECONDARY_UPLOADING_INVENTORY, PRIMARY_UPLOADING_METADATA und SECONDARY_DOWNLOADING_METADATA einer Replikationsaktualisierung verbracht wird, indem die serverlose Rechenzuweisung optimiert wird. Diese Verbesserung zielt auf Aktualisierungen mit größeren Metadaten ab.
September 2024	Verbesserte Operationen zum Klonen durch Parallelisierung.	Verringert den Zeitaufwand für das Klonen von Objekten, insbesondere für Datenbanken und Schemas mit umfangreichen Metadaten.
September 2024	Verbesserte Aktualisierungen der Replikation durch Parallelisierung.	Verkürzt die gesamte Aktualisierungszeit bei der Replikation von großen Datenmengen.
August 2024	Verbesserte Leistung für LIMIT-Abfragen.	Verkürzt die Kompilierungs- und Ausführungszeit für Abfragen, die eine LIMIT-Klausel verwenden, um `n` Zeilen aus einer Tabelle zurückzugeben. Durch diese Optimierung werden die Partitionen, die durchsucht werden, so verkleinert, dass nur die ersten `n` Zeilen abgedeckt werden.
Juli 2024	Verbesserte Synchronisierung von Tabellenspalten für die Replikation.	Verkürzt die Zeit, die in der SECONDARY_DOWNLOADING_METADATA-Phase einer Aktualisierungsoperation verbracht wird.
Juli 2024	Bessere Auslastung des Warehouse bei Abfragen, die nur eine geringe Anzahl von Mikropartitionen durchsuchen, im Vergleich zu den Computeressourcen, die dem virtuellen Warehouse zur Verfügung stehen.	Schnellere Ausführung von Abfragen mit kostspieligen Operationen beim Scannen von Daten aus einer kleinen Anzahl von Mikropartitionen, wie sie in BI- und Dashboard-Anwendungsfällen üblich sind.
Juli 2024	Verbesserte Verarbeitung von Abfragen: Verschiebt LIMIT-Klauseln in Aggregationsknoten, die außer der Funktion ANY_VALUE keine weiteren Aggregationen enthalten. Eliminiert redundante Schlüssel, wenn PRIMARY KEY- oder UNIQUE-Einschränkungen durch Validierung erzwungen werden oder wenn die RELY-Einschränkungseigenschaft verwendet wird.	Schnellere Ausführung einiger Abfragen mit LIMIT-Klauseln und GROUP BY-Anweisungen.
Juni 2024	Verbesserte Verarbeitung von einzelnen Anweisungen mit mehreren Daten (SIMD).	Verkürzt die Ausführung von Abfragen und verbessert die Leistung von Abfragen, die auf Spalten zugreifen, die NULL-Werte enthalten. Sorgt für eine bessere Leistung beim Scannen durch effizientere Dekodierung von Zahlen beim Lesen von Daten aus Remote-Speichern.
Mai 2024	Verbesserte Effizienz von Automatic Clustering.	Reduziert die Kosten für Automatic Clustering, da es effizienter arbeitet.
Mai 2024	Verbesserte Objektreplikation.	Reduziert die Zeit, die in den Phasen SECONDARY_UPLOADING_INVENTORY und SECONDARY_DOWNLOADING_METADATA einer Aktualisierungsoperation verbracht wird, indem die Synchronisierung einiger Objekte und der Autorisierungsmechanismus für Replikationsoperationen optimiert wurden.
Mai 2024	Reduzierte Latenz beim Laden der meisten Parquet-Dateien wurde um bis zu 50 %, wenn Dateiformatoption USE_VECTORIZED_SCANNER auf `TRUE` eingestellt ist.	Der vektorisierte Scanner eignet sich gut für das spaltenweise Format einer Parquet-Datei und reduziert die Datenaufnahmelatenz, indem nur relevante Abschnitte der Parquet-Datei in den Arbeitsspeicher heruntergeladen werden, z. B. die Teilmenge der ausgewählten Spalten.
Mai 2024	Verbesserte Evaluation von Aggregationen, die an mehr mittleren Join-Bäumen erfolgen.	Die Ausführungszeit von komplexen Abfragen mit Aggregationen wurde reduziert, indem die zu verarbeitende Datenmenge zum frühestmöglichen Zeitpunkt reduziert wird.
Mai 2024	Verbesserte Ausführungszeiten von Abfragen, die viel Zeit für die Kommunikation zwischen virtuellen Warehouse-Knoten verbrauchen.	Erhöht den Durchsatz zwischen Computeressourcen in einem Warehouse. Jedes virtuelle Warehouse ist ein Cluster von Computeressourcen.
Mai 2024	Verbessertes Top-k-Pruning bei LIMIT- und ORDER BY-Abfragen.	Reduziert die Ausführungszeit von Top-k-Abfragen, da weniger Dateien gescannt und Dateiheader gelesen werden. Erweitert die bestehenden Top-k-Verbesserungen um die Unterstützung von STRING und BINARY in ORDER BY-Spalten. Erhöht die Pruning-Effizienz weiter, indem der Scan-Satz in der Reihenfolge der größten/kleinsten Dateien in Bezug zum Wertebereich sortiert wird.
Mai 2024	Verbesserte Entscheidungen zur Join-Reihenfolge durch Berechnung von Selektivitätsschätzungen mit größerer Granularität.	Reduziert die Kompilierungs- und Abfrageausführungszeit durch die Berechnung von Selektivitätsschätzungen auf Mikropartitionsebene.
Mai 2024	Schnelleres Laden von Python.	Verbessert die Leistung von Streamlit in Snowflake-Apps (einschließlich Streamlit-Apps innerhalb einer Snowflake Native App), Python-Arbeitsblättern, Python-UDFs und gespeicherten Prozeduren in Python.
April 2024	Reduzierte Begrenzung von lock/mutex.	Reduziert die Ausführungszeiten von Abfragen durch verbesserte Scan-Leistung in Vielzahl von Szenarios, z. B. bei hochgradig parallelen Abfragen in einem Warehouse.
April 2024	Verbesserte Entscheidungen bei Broadcast-Joins.	Reduziert Ausführungszeit von Abfragen und verbessert Arbeitsspeicherverwaltung durch Optimierung von Broadcast-Joins in Szenarios wie rechts-tiefen Join-Bäumen.
April 2024	Schnellere Abfrageergebnisse in Snowsight.	Verringert die Zeit bis zur Anzeige der Abfrageergebnisse bei Ausführung in Snowsight. Verbesserungen sind vor allem bei Abfragen bemerkbar, die Resultsets mit mehr als 10.000 Zeilen zurückgeben.
März 2024	Verbesserte Replikation von Metadaten.	Reduziert die Zeit, die in den Phasen PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA und SECONDARY_UPLOADING_INVENTORY für Metadaten verbracht wird.
März 2024	Verbesserte Abfrageleistung durch genauere Berechnung von Selektivitätsschätzungen zur Optimierung der Reihenfolge von Joins.	Verringert die Ausführungszeit, wenn die Metadaten der Partition und die tatsächliche Kardinalität der Join-Filter nicht übereinstimmen.
März 2024	Verbesserte Leistung beim Laden von JSON-Dateien.	Führt zu einer um bis zu 25 % geringeren Datenaufnahmelatenz in vielen JSON-Ladeszenarios.
Februar 2024	Verbesserte Objektreplikation.	Reduziert die Zeit, die in den Phasen PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA und SECONDARY_UPLOADING_INVENTORY einer Aktualisierungsoperation verbracht wird, indem Teile der Snapshot-Operation und die Vorgehensweise beim Hinzufügen einiger Objekte zum Replikationsbestand optimiert werden.
Februar 2024	Unterstützung der Sortierungsspezifikationen `upper` und `lower` zu einigen Funktionen hinzugefügt.	Möglichkeit, die Sortierungsspezifikationen `upper` und `lower` für bestimmte Funktionen festzulegen. Die Sortierungsspezifikationen `upper` und `lower` sind in einigen Anwendungsfällen leistungsfähiger als die `ci`-Spezifikation. Die Sortierungsspezifikationen `upper` und `lower` werden jetzt für die folgenden Funktionen unterstützt: CHARINDEX, CONTAINS, ENDSWITH, POSITION, SPLIT, SPLIT_PART und STARTSWITH. Weitere Informationen dazu finden Sie unter Unterschiede zwischen ci und upper/lower.
Januar 2024	Verbesserte Ausführungszeit für LIMIT 0-Abfragen.	Reduziert die Ausführungszeit von Abfragen, die eine Anzahl von `0` mit LIMIT verwenden, was häufig in Anwendungen zur Rückgabe von Spaltenüberschriften und Datentypen für Abfrageergebnisse verwendet wird.
Januar 2024	Allgemeine Verfügbarkeit von größeren Warehouses (5X-LARGE und 6X-LARGE) in Microsoft Azure-Regionen, ausgenommen Azure Government-Regionen.	Möglichkeit der Nutzung größerer Computeressourcen für Abfragen mit hohem Arbeitsspeicherbedarf anstelle von kleineren Warehouses.