2024年11月15日 --- Apache Iceberg™ テーブル: 効率的な一括ロード、継続的なインジェスチョン、データストリーミング --- 一般公開¶
このリリースにより、Snowflakeは、Snowflakeが管理するIcebergテーブルへの効率的な一括ロード、継続的なインジェスチョン、データストリーミングをサポートする以下の機能の一般公開を発表します。
COPY INTO <table>、Snowpipe、Snowpipe StreamingなどのSnowflakeインジェスチョン機能と同じコア機能を使用して、標準のSnowflakeテーブルとIcebergテーブルの両方にデータをロードできるようになりました。
詳細については、 Apache Iceberg™ テーブルへのデータのロード をご参照ください。
COPY INTO <テーブル>とSnowpipeの継続的なファイルインジェスチョン¶
以下の LOAD_MODE
オプションを COPY INTO <テーブル> コマンドおよび Snowpipe自動ロード と併用することで、Snowflake管理下のIcebergテーブルにファイルからデータをロードすることができます。
FULL_INGEST
: サポートされているファイル形式からデータをロードして、有効なIceberg互換Parquetに変換し、オプションでデータをロードする前にデータの変換やフィルターを行うことができます。ADD_FILES_COPY
: Iceberg互換Parquetデータファイルからデータのロードを行います。サーバーサイドでファイルをテーブルのベーステーブルにコピーし、ファイルをテーブルに高速登録します。
Snowpipe Streaming¶
Snowflake Ingest SDK バージョン3.0.0以降では、Snowpipe StreamingはSnowflake管理下のIcebergテーブルに行をストリームすることができます。この機能を有効にするには、 profile.json
ファイルでプロパティ ENABLE_ICEBERG_STREAMING=true
をセットします。
詳細については、 Apache Iceberg™ テーブルへのデータのロード をご参照ください。