Einfluss der Warehouse-Konfigurationen auf die Leistung dynamischer Tabellen

Die Größe eines Warehouses korreliert nicht immer mit seinen Kosten. Um eine optimale Warehouse-Größe auszuwählen, experimentieren Sie und vergleichen Sie die Leistung einer Abfrage mit verschiedenen Warehouse-Größen.

In der Regel erhöhen größere Warehouses die Abfrageleistung durch mehr Arbeitsspeicher und Parallelität:

  • Arbeitsspeicher: Wenn eine Abfrage mehr Arbeitsspeicher benötigt, als das Warehouse zur Verfügung stellen kann, werden Zwischendaten in den lokalen Speicher ausgelagert, wodurch sich der Gesamtaufwand für die Abfrage erhöht. Ein größeres Warehouse kann dieses Überlaufen verhindern und die Abfrage erheblich beschleunigen.

  • Parallelisierung: Parallelisierung lässt eine Abfrage schneller laufen, indem die Arbeit in mehrere Teile aufgeteilt wird, die jeweils schneller abgeschlossen werden. Solange die Abfrage genügend Parallelität bietet, verkürzt eine Vergrößerung des Warehouses in der Regel die Abfragezeit, ohne die Kosten zu erhöhen. Wenn Sie beispielsweise von einem kleinen auf ein mittelgroßes Warehouse umsteigen, verdoppeln sich in der Regel die Kosten, während sich die Laufzeit halbiert.

    Ab einem bestimmten Punkt nimmt der Nutzen zusätzlicher Parallelität jedoch ab. Daher ist die kostenoptimale Warehouse-Größe in der Regel groß genug, um ein Überlaufen zu verhindern, aber klein genug, um eine sättigende Parallelität zu vermeiden. Die optimale Größe für Aktualität ist normalerweise etwas größer.

Wenn Ihre dynamischen Tabellen inkrementell aktualisiert werden, erfordert die erste Aktualisierung oft ein größeres Warehouse als die nachfolgenden Aktualisierungen. Passen Sie Ihren Workflow an, indem Sie mit einer größeren Warehouse-Größe beginnen, Ihre dynamischen Tabellen erstellen und das Warehouse dann wieder verkleinern.

Weitere Informationen zur Dimensionierung von Warehouses und den damit verbundenen Kosten finden Sie unter Credit-Nutzung für virtuelle Warehouses.