Leistungsverbesserungen 2024

Wichtig

Leistungsverbesserungen zielen oft auf bestimmte Abfragemuster oder Workloads ab. Diese Verbesserungen können erhebliche Auswirkungen auf einen bestimmten Workload haben, müssen es aber nicht.

Die folgenden Leistungsverbesserungen wurden 2024 eingeführt.

Release

Beschreibung

Auswirkung

Oktober 2024

Verbesserte Replikation von Metadaten.

Reduziert die Zeit, die in den Phasen SECONDARY_UPLOADING_INVENTORY, PRIMARY_UPLOADING_METADATA und SECONDARY_DOWNLOADING_METADATA einer Replikationsaktualisierung verbracht wird, indem die serverlose Rechenzuweisung optimiert wird. Diese Verbesserung zielt auf Aktualisierungen mit größeren Metadaten ab.

September 2024

Verbesserte Operationen zum Klonen durch Parallelisierung.

Verringert den Zeitaufwand für das Klonen von Objekten, insbesondere für Datenbanken und Schemas mit umfangreichen Metadaten.

September 2024

Verbesserte Aktualisierungen der Replikation durch Parallelisierung.

Verkürzt die gesamte Aktualisierungszeit bei der Replikation von großen Datenmengen.

August 2024

Verbesserte Leistung für LIMIT-Abfragen.

Verkürzt die Kompilierungs- und Ausführungszeit für Abfragen, die eine LIMIT-Klausel verwenden, um n Zeilen aus einer Tabelle zurückzugeben. Durch diese Optimierung werden die Partitionen, die durchsucht werden, so verkleinert, dass nur die ersten n Zeilen abgedeckt werden.

Juli 2024

Verbesserte Synchronisierung von Tabellenspalten für die Replikation.

Verkürzt die Zeit, die in der SECONDARY_DOWNLOADING_METADATA-Phase einer Aktualisierungsoperation verbracht wird.

Juli 2024

Bessere Auslastung des Warehouse bei Abfragen, die nur eine geringe Anzahl von Mikropartitionen durchsuchen, im Vergleich zu den Computeressourcen, die dem virtuellen Warehouse zur Verfügung stehen.

Schnellere Ausführung von Abfragen mit kostspieligen Operationen beim Scannen von Daten aus einer kleinen Anzahl von Mikropartitionen, wie sie in BI- und Dashboard-Anwendungsfällen üblich sind.

Juli 2024

Verbesserte Verarbeitung von Abfragen:

  • Verschiebt LIMIT-Klauseln in Aggregationsknoten, die außer der Funktion ANY_VALUE keine weiteren Aggregationen enthalten.

  • Eliminiert redundante Schlüssel, wenn PRIMARY KEY- oder UNIQUE-Einschränkungen durch Validierung erzwungen werden oder wenn die RELY-Einschränkungseigenschaft verwendet wird.

Schnellere Ausführung einiger Abfragen mit LIMIT-Klauseln und GROUP BY-Anweisungen.

Juni 2024

Verbesserte Verarbeitung von einzelnen Anweisungen mit mehreren Daten (SIMD).

  • Verkürzt die Ausführung von Abfragen und verbessert die Leistung von Abfragen, die auf Spalten zugreifen, die NULL-Werte enthalten.

  • Sorgt für eine bessere Leistung beim Scannen durch effizientere Dekodierung von Zahlen beim Lesen von Daten aus Remote-Speichern.

Mai 2024

Verbesserte Effizienz von Automatic Clustering.

Reduziert die Kosten für Automatic Clustering, da es effizienter arbeitet.

Mai 2024

Verbesserte Objektreplikation.

Reduziert die Zeit, die in den Phasen SECONDARY_UPLOADING_INVENTORY und SECONDARY_DOWNLOADING_METADATA einer Aktualisierungsoperation verbracht wird, indem die Synchronisierung einiger Objekte und der Autorisierungsmechanismus für Replikationsoperationen optimiert wurden.

Mai 2024

Reduzierte Latenz beim Laden der meisten Parquet-Dateien wurde um bis zu 50 %, wenn Dateiformatoption USE_VECTORIZED_SCANNER auf TRUE eingestellt ist.

Der vektorisierte Scanner eignet sich gut für das spaltenweise Format einer Parquet-Datei und reduziert die Datenaufnahmelatenz, indem nur relevante Abschnitte der Parquet-Datei in den Arbeitsspeicher heruntergeladen werden, z. B. die Teilmenge der ausgewählten Spalten.

Mai 2024

Verbesserte Evaluation von Aggregationen, die an mehr mittleren Join-Bäumen erfolgen.

Die Ausführungszeit von komplexen Abfragen mit Aggregationen wurde reduziert, indem die zu verarbeitende Datenmenge zum frühestmöglichen Zeitpunkt reduziert wird.

Mai 2024

Verbesserte Ausführungszeiten von Abfragen, die viel Zeit für die Kommunikation zwischen virtuellen Warehouse-Knoten verbrauchen.

Erhöht den Durchsatz zwischen Computeressourcen in einem Warehouse. Jedes virtuelle Warehouse ist ein Cluster von Computeressourcen.

Mai 2024

Verbessertes Top-k-Pruning bei LIMIT- und ORDER BY-Abfragen.

Reduziert die Ausführungszeit von Top-k-Abfragen, da weniger Dateien gescannt und Dateiheader gelesen werden. Erweitert die bestehenden Top-k-Verbesserungen um die Unterstützung von STRING und BINARY in ORDER BY-Spalten. Erhöht die Pruning-Effizienz weiter, indem der Scan-Satz in der Reihenfolge der größten/kleinsten Dateien in Bezug zum Wertebereich sortiert wird.

Mai 2024

Verbesserte Entscheidungen zur Join-Reihenfolge durch Berechnung von Selektivitätsschätzungen mit größerer Granularität.

Reduziert die Kompilierungs- und Abfrageausführungszeit durch die Berechnung von Selektivitätsschätzungen auf Mikropartitionsebene.

Mai 2024

Schnelleres Laden von Python.

Verbessert die Leistung von Streamlit in Snowflake-Apps (einschließlich Streamlit-Apps innerhalb einer Snowflake Native App), Python-Arbeitsblättern, Python-UDFs und gespeicherten Prozeduren in Python.

April 2024

Reduzierte Begrenzung von lock/mutex.

Reduziert die Ausführungszeiten von Abfragen durch verbesserte Scan-Leistung in Vielzahl von Szenarios, z. B. bei hochgradig parallelen Abfragen in einem Warehouse.

April 2024

Verbesserte Entscheidungen bei Broadcast-Joins.

Reduziert Ausführungszeit von Abfragen und verbessert Arbeitsspeicherverwaltung durch Optimierung von Broadcast-Joins in Szenarios wie rechts-tiefen Join-Bäumen.

April 2024

Schnellere Abfrageergebnisse in Snowsight.

Verringert die Zeit bis zur Anzeige der Abfrageergebnisse bei Ausführung in Snowsight. Verbesserungen sind vor allem bei Abfragen bemerkbar, die Resultsets mit mehr als 10.000 Zeilen zurückgeben.

März 2024

Verbesserte Replikation von Metadaten.

Reduziert die Zeit, die in den Phasen PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA und SECONDARY_UPLOADING_INVENTORY für Metadaten verbracht wird.

März 2024

Verbesserte Abfrageleistung durch genauere Berechnung von Selektivitätsschätzungen zur Optimierung der Reihenfolge von Joins.

Verringert die Ausführungszeit, wenn die Metadaten der Partition und die tatsächliche Kardinalität der Join-Filter nicht übereinstimmen.

März 2024

Verbesserte Leistung beim Laden von JSON-Dateien.

Führt zu einer um bis zu 25 % geringeren Datenaufnahmelatenz in vielen JSON-Ladeszenarios.

Februar 2024

Verbesserte Objektreplikation.

Reduziert die Zeit, die in den Phasen PRIMARY_UPLOADING_METADATA, SECONDARY_DOWNLOADING_METADATA und SECONDARY_UPLOADING_INVENTORY einer Aktualisierungsoperation verbracht wird, indem Teile der Snapshot-Operation und die Vorgehensweise beim Hinzufügen einiger Objekte zum Replikationsbestand optimiert werden.

Februar 2024

Unterstützung der Sortierungsspezifikationen upper und lower zu einigen Funktionen hinzugefügt.

Möglichkeit, die Sortierungsspezifikationen upper und lower für bestimmte Funktionen festzulegen. Die Sortierungsspezifikationen upper und lower sind in einigen Anwendungsfällen leistungsfähiger als die ci-Spezifikation. Die Sortierungsspezifikationen upper und lower werden jetzt für die folgenden Funktionen unterstützt: CHARINDEX, CONTAINS, ENDSWITH, POSITION, SPLIT, SPLIT_PART und STARTSWITH. Weitere Informationen dazu finden Sie unter Unterschiede zwischen ci und upper/lower.

Januar 2024

Verbesserte Ausführungszeit für LIMIT 0-Abfragen.

Reduziert die Ausführungszeit von Abfragen, die eine Anzahl von 0 mit LIMIT verwenden, was häufig in Anwendungen zur Rückgabe von Spaltenüberschriften und Datentypen für Abfrageergebnisse verwendet wird.

Januar 2024

Allgemeine Verfügbarkeit von größeren Warehouses (5X-LARGE und 6X-LARGE) in Microsoft Azure-Regionen, ausgenommen Azure Government-Regionen.

Möglichkeit der Nutzung größerer Computeressourcen für Abfragen mit hohem Arbeitsspeicherbedarf anstelle von kleineren Warehouses.