Introduction to streams and tasks

Snowflakeはストリームとタスクで連続データパイプラインをサポートします。

ストリーム:

ストリーム オブジェクトは、挿入やその他のデータ操作言語(DML)の変更を含む、テーブル(ステージングテーブルなど)の変更データキャプチャ(CDC)のデルタ情報を記録します。ストリームを使用すると、2つのトランザクションポイント間で、行レベルによるテーブルの一連の変更をクエリおよび利用できます。

連続データパイプラインでは、連続データロードを使用してステージングテーブルおよびダウンストリームテーブルにビジネスアプリケーションからのデータが入力され、 SQL ステートメントを使用してさらに処理できる状態になると、テーブルストリームが記録します。

詳細については、 Introduction to streams をご参照ください。

タスク:

A task object runs a SQL statement, which can include calls to stored procedures. Tasks can run on a schedule or based on a trigger that you define, such as the arrival of data. You can use task graphs to chain tasks together, defining directed acyclic graphs (DAGs) to support more complex periodic processing. For more information, see タスクの紹介 and タスクグラフで一連のタスクを作成.

タスクとテーブルストリームを組み合わせることは、新しいデータや変更されたデータを継続的に処理する便利で強力な方法です。タスクは、ストリームが表面化した新しい行や変更された行を、 SYSTEM$STREAM_HAS_DATA を使って変換することができます。タスクが実行されるたびに、変更データを消費するか、変更データが存在しない場合は現在の実行をスキップします。

その他の連続データパイプライン機能については、こちらをご参照ください: