Openflow Connector for Excel について

注釈

コネクタには、 コネクタ利用規約 が適用されます。

このトピックでは、 Openflow Connector for Excel の基本概念、ワークフロー、および制限事項について説明します。

Openflow Connector for Excel は、 AWS S3インスタンスまたはMicrosoft SharePoint サイトとSnowflakeを接続し、Microsoft Excelファイルを定期的に取り込み、取り込んだデータをSnowflakeテーブル内に格納します。

コネクタは以下の取り込みをサポートします。

  • すべてのExcelスプレッドシート

  • 指定したExcelスプレッドシート

  • Excelワークブックに存在するデータの指定した範囲

コネクタは切り捨てとロードの取り込みのみを実行します。つまり、ファイルが取り込まれるたびに、Snowflakeの既存のデータはそのファイルの新しいデータに完全に置き換えられます。

このコネクタは、以下を実行する場合に使用します。

  • レポート作成や分析のため、Microsoft ExcelスプレッドシートからSnowflakeテーブルにデータをロードする

  • レポート作成や分析のため、 SharePoint のExcelスプレッドシートからSnowflakeテーブルにデータをロードする

ワークフロー

データソースに基づいて、コネクタのワークフローは以下のようになります。

AWS S3インスタンスを接続するワークフロー

  1. AWS 管理者は以下のタスクを実行します。

    1. AWS アカウントに IAM ユーザーと認証情報を作成します。

    2. S3インスタンスが存在する AWS リージョンをメモします(例: us-west-2)。

    3. 取り込むファイルを識別子で指定します。

  2. Snowflakeアカウント管理者は以下のタスクを実行します。

    1. Snowflake内での希望するデータベース名とスキーマ名を設定します。

    2. コネクタが使用するウェアハウスを指定します。

    3. コネクタが使用するSnowflakeユーザーと、このユーザーのロールを構成します。

  3. データエンジニアは以下のタスクを実行します。

    1. コネクタ定義ファイルをダウンロードしてSnowflake Openflowキャンバスにインポートします。

    2. コネクタのパラメーターを構成します。

      1. AWS 認証情報を提供します。

      2. Snowflakeユーザーの認証情報と構成を提供します。

      3. フィルターを提供することで、取り込まれるオブジェクトの基準を定義します。

    3. Openflowキャンバス内でフローを開始します。実行時、フローは以下のアクションを実行します。

      1. 指定したファイルをS3バケットからダウンロードします。

      2. 関連データを抽出します。

      3. Snowflakeデータベースに構成された宛先テーブルを作成します。

      4. 処理したデータを指定のSnowflakeテーブルにロードします。

Microsoft SharePoint サイトを接続するワークフロー

  1. SharePoint 管理者は以下のタスクを実行します。

    1. 新しい Microsoft Entraアプリケーション を作成します。

    2. OAuth 認証を有効にするために SharePoint を構成します。

    3. 取り込むファイルを識別子で指定します。

  2. Snowflakeアカウント管理者は以下のタスクを実行します。

    1. Snowflake内での希望するデータベース名とスキーマ名を設定します。

    2. コネクタが使用するウェアハウスを指定します。

    3. コネクタが使用するSnowflakeユーザーと、このユーザーのロールを構成します。

  3. データエンジニアは以下のタスクを実行します。

    1. コネクタ定義ファイルをダウンロードしてSnowflake Openflowキャンバスにインポートします。

    2. コネクタのパラメーターを構成します。

      1. SharePoint 認証情報を提供します。

      2. Snowflakeユーザーの認証情報と構成を提供します。

      3. フィルターを提供することで、取り込まれるオブジェクトの基準を定義します。

    3. Openflowキャンバス内でフローを開始します。実行時、フローは以下のアクションを実行します。

      1. SharePoint サイトから指定したファイルをダウンロードします。

      2. 関連データを抽出します。

      3. Snowflakeデータベースに構成された宛先テーブルを作成します。

      4. 処理したデータを指定のSnowflakeテーブルにロードします。

制限事項

  • 現在、.xlsxファイル(Office 2007以降のバージョン)のみがサポートされています。以下のファイルタイプはサポートされていません。

    • .xlsファイル(Office 97~Office 2003バージョン)

    • .xlsmファイル(マクロ対応ワークブック)

    • .xlsbファイル(バイナリワークブック)

  • 大容量の.xlsxファイルは、Openflowランタイムに過負荷をかけたり、他のコネクタフローに影響を与える問題を引き起こす可能性があります。メモリ制限のため、ファイルのサイズは(コネクタがすべてのノードリソースを使用できると仮定して)、次のサイズ以下にする必要があります。

    • Small ランタイムノードの場合は、2 MB。

    • Medium ランタイムノードの場合は、10 MB。

    • Large ランタイムノードの場合は、20 MB。

  • 同じ列の中にデータ型が混在している列(例: 数値と文字列)がある場合:

    • 値はSnowflakeテーブルに VARIANTs として保存されます。

    • 取り込まれたデータのスキーマ(つまり列のデータ型)は、現在、最初の10行を使って推測されています。最初の10行が同じ型である場合、列のタイプが混在していると正しく認識されない可能性があります。

  • 特定の範囲を指定せずにスプレッドシート全体を取り込む場合は、セルA1から始まる最初の行をヘッダー行とし、列名を含める必要があります。

次のステップ

Openflow Connector for Excel を設定する