Snowflake Data Clean Room:Google Cloud Platformの外部データ

Snowflake Data Clean Room で分析されるデータは、Snowflakeネイティブであり、クラウドプロバイダーストレージの外部、またはその両方に存在することができます。 connector により、共同作業者はクリーンルーム内からクラウドプロバイダーの外部データにアクセスできます。

外部データコネクタは、 Snowflake外部テーブル を使用してデータを利用できるようにします。クリーンルーム内で外部テーブルをリンクさせることは、セキュリティ上のリスクが高まることに注意してください。その結果、コンシューマーが外部データを含めるためにコネクタを使用する前に、プロバイダーはクリーンルーム内で外部テーブルの使用を明示的に許可しなければなりません。プロバイダーが外部データコネクタを使用する場合、コンシューマーは外部テーブルが使用されていることを警告され、クリーンルームをインストールするかどうかを決めることができます。

このトピックでは、クリーンルームのアナリストがGoogle Cloud Platformバケットから外部データにアクセスできるように、コネクタを使用する方法について説明します。

重要

サードパーティコネクタは、Snowflake提供ではないため、追加条件が適用される場合があります。これらの統合は、お客様の便宜のために提供されるものですが、統合に送受信されるコンテンツについては、お客様が責任を負うものとします。

お客様は、Snowflake Data Clean Roomsの使用に関連して必要な同意を取得する責任を負うものとします。アクティベーションを目的としたサードパーティコネクタとの接続も含め、Snowflake Data Clean Roomsを使用する際は、適用される法律および規制を遵守していることを確認してください。

前提条件

外部データ用コネクタを使用するには:

Google Cloud Platformバケットへの接続

クリーンルームのコラボレーターがGoogle Cloud Platform(GCP)ストレージからデータにアクセスできるようにする手順は以下のとおりです。

  1. GCP では、 GCP バケットの URL を取得 します。

  2. クリーンルーム環境では、 コネクタを作成 します。

  3. GCP では、 コネクタへのアクセス許可を付与 します。

  4. クリーンルーム環境では、 GCP でコネクタを認証 します。

以下のセクションでは、これらの手順について詳しく説明します。

GCP バケットの URL を取得する

クリーンルームコネクタがデータにアクセスするには、GCPストレージバケットのURLが必要です。コネクタを作成する前に、次を実行する必要があります。

  1. プロジェクトエディターとしてGoogle Cloud Platform Consoleにサインインします。

  2. コンソールダッシュボードから、 Cloud Storage » Browser を選択します。

  3. クリーンルームからアクセスするデータを含むバケットを選択し、そのデータの場所に移動します。バケットを空にすることはできません。

  4. コピーアイコンを選択して、ストレージバケットのURLをコピーし、次のタスクのために保存します。

コネクタを作成し、サービスアカウントの識別子をコピーする

これで、クリーンルーム環境でコネクタを作成する準備が整いました。コネクタを作成したら、GCPでバケットに関連付けられるように、そのサービスアカウントの詳細をコピーする必要があります。クリーンルーム環境でコネクタを作成するには:

  1. Snowflake Data Clean Roomsのログインページ に移動します。

  2. メールアドレスを入力し、 Continue を選択します。

  3. パスワードを入力してください。

  4. 複数のクリーンルーム環境に関連している場合は、使用するSnowflakeアカウントを選択します。

  5. 左のナビゲーションで、 Connectors を選択し、 Google Cloud セクションを展開します。

  6. Storage bucket URL フィールドに、GCP からコピーした URL を入力し、URL の https://gcs:// に置き換えます。

  7. Create を選択します。クリーンルームは、GCPにアクセスするために使用するサービスアカウントを生成します。

  8. コピーアイコンを使用して、サービスアカウントの識別子をコピーし、次のタスクのために保存します。

コネクタへアクセス許可を付与する

クリーンルームでは、GCPバケット内の外部データへのアクセス許可が必要です。これらの権限を付与するには、コネクタのサービスアカウント専用のGCPロールを作成し、GCPバケットのプリンシパルとしてサービスアカウントを追加します。

コネクタのサービスアカウント専用のGCPロールを作成します。

  1. プロジェクトエディターとしてGoogle Cloud Platform Consoleにサインインします。

  2. コンソールダッシュボードから、 IAM & admin » Roles を選択します。

  3. Create Role を選択します。

  4. ロールの名前と説明を入力します。

  5. Add Permissions を選択し、以下の権限を追加します。

  • storage.buckets.get

  • storage.objects.list

  • storage.objects.get

専用のロールを作成したので、コネクタのサービスアカウントをGCPバケットのプリンシパルとして関連付ける準備ができました。サービスアカウントを関連付けるには:

  1. プロジェクトエディターとしてGoogle Cloud Platform Consoleにサインインします。

  2. コンソールダッシュボードから、 Cloud Storage » Browser を選択します。

  3. 外部データを含むバケットを選択します。

  4. Show Info Panel を選択します。情報パネルがスライドして開きます。

    Google Cloud Platformバケットの情報パネルを表示します。
  5. Add Principals を選択します。

  6. New Principals テキストボックスに、クリーンルームからコピーしたサービスアカウント識別子を貼り付けます。

  7. Select a role ドロップダウンリストから、サービスアカウント用に作成した専用ロールを選択します。

コネクタの認証コード

これで、コネクタがGCPバケットにアクセスできることを確認するための認証コードの準備ができました。コネクタを認証するためには:

  1. クリーンルームの左ナビゲーションで、 Connectors を選択し、 Google Cloud セクションを展開します。クリーンルームからサインアウトされた場合は、 ウェブアプリにサインインする をご参照ください。

  2. 接続先の GCP バケットを選択し、 Authenticate を選択します。

GCPの外部データへのアクセスを削除する

クリーンルーム環境からGCPバケットへのアクセスを削除するには:

  1. Snowflake Data Clean Roomsのログインページ に移動します。

  2. メールアドレスを入力し、 Continue を選択します。

  3. パスワードを入力してください。

  4. 複数のクリーンルーム環境に関連している場合は、使用するSnowflakeアカウントを選択します。

  5. 左のナビゲーションで、 Connectors を選択し、 Google Cloud セクションを展開します。

  6. 現在接続されているGCPバケットを見つけ、ゴミ箱アイコンを選択します。