データロードの計画

このトピックでは、ベストプラクティス、一般的なガイドライン、およびデータロードの計画に関する重要な考慮事項について説明します。

このトピックの内容:

ロードおよびクエリ操作専用の個別のウェアハウス

大きなデータセットをロードすると、クエリのパフォーマンスに影響する可能性があります。それぞれのパフォーマンスを最適化するため、ロード操作とクエリ操作向けにそれぞれ別のウェアハウスを専用に指定することをお勧めします。

並行して処理できるデータファイルの数は、ウェアハウス内のサーバーの数と容量によって決まります。 データファイルの準備 で説明されているファイルサイズのガイドラインに従うと、データのロードは最小限のリソースで済みます。大きなデータファイルを分割すると、ロードを直線的にスケーリングできます。大量のファイル(つまり、数百または数千のファイル)を同時に一括ロードする場合を除き、通常は、より小さなウェアハウス(小、中、大)で十分です。より大きなウェアハウス(XL、2XLなど)を使用すると、より多くのクレジットが消費され、パフォーマンスの向上がみられない場合があります。