Openflow Connector for Kinesis について

注釈

このコネクタは、 Snowflakeコネクタ規約 に従うものとします。

このトピックでは、ワークフローや制限など、 Openflow Connector for Kinesis の基本的な概念について説明します。

Amazon Kinesis Data Streams を使用すると、リアルタイムでデータ記録の大容量ストリームを収集して処理できます。プロデューサーは継続的にデータをKinesisデータストリームにプッシュし、コンシューマーはリアルタイムでデータを処理します。

Kinesisデータストリームは シャード のセットです。各シャードには一連のデータ記録があります。データ記録はKinesisデータストリームに格納されるデータの単位です。データ記録は、シーケンス番号、パーティションキー、データブロブ(不変のバイト列)で構成されます。

Openflow Connector for Kinesis は、Snowpipe Streaming を使用して、Kinesisデータストリームからデータを読み取り、Snowflakeテーブルに書き込みます。

ユースケース

Amazon Kinesis Data StreamsからSnowflakeにリアルタイムイベントを取り込んで、リアルタイムに近しい分析を実行する場合は、このコネクタを使用します。

ワークフロー

AWS 管理者のタスク

  1. Kinesis Streamと関連する DynamoDB に接続するコネクタの認証情報を作成します。

  2. KCL コンシューマーアプリケーションに必要な IAM 権限 にリストされている権限を持つ IAM ポリシーを設定します。

  3. ストリーム名とアプリケーション名を記録し、Snowflakeアカウント管理者に提供します。これらはランタイムでコネクタを設定する際に必要です。

Snowflakeアカウント管理者のタスク ------------------------------------------------------------------------------------------------===

  1. コネクタをインストールします。

  2. コネクタを構成します。
    1. AWS およびSnowflakeの認証情報と設定を指定します。

    2. Kinesisストリーム名を指定します。

    3. Snowflakeアカウントでデータベース名とスキーマ名を設定します。

    4. その他のパラメーターをカスタマイズします。

  3. Openflowキャンバスでコネクタを実行します。実行されると、コネクタは次のアクションを実行します。
    1. Kinesisストリームのチェックポイントを格納するための DynamoDB テーブルを作成します。

    2. ストリームデータを抽出します。

    3. ストリームから少なくとも1つの記録を受信した場合、Snowflakeデータベースに構成された宛先テーブルを作成します。

    4. 処理したデータを指定したSnowflakeテーブルにロードします。

ビジネスユーザーのタスク ------------------------------------------------------------------------------------------------===

Kinesisから宛先テーブルにダウンロードされたデータに対して操作を実行します。

制限事項

  • コネクタは単一のストリームのみをサポートします。

  • 手動で作成したテーブルを使用する場合:
    • テーブル名は、保持するデータのストリームと完全に一致する必要があります。

    • テーブル名は大文字にする必要があります。

  • コネクタは JSON メッセージ形式のみをサポートします。

  • コネクタはAmazonアクセスキー IAM 認証のみをサポートします。

  • コネクタは失敗したメッセージをSnowflakeログに記録し、 DLQ ストリームにルーティングしません。

次のステップ

コネクタの設定方法については、次のトピックをご参照ください。