2025年8月21日:AI Parse Documentレイアウトモード(一般提供

高度なレイアウト抽出機能を備えたSnowflake Cortex AI_PARSE_DOCUMENT ドキュメントが一般公開されるようになりました。この完全に管理されている SQL 関数は、Markdown形式でページのレイアウトを抽出し、エンタープライズグレードの精度とスケールで、ドキュメントからのテキスト、テーブル、構造要素を保持します。

注釈

AI_PARSE_DOCUMENT 関数は、 SNOWFLAKE.CORTEX.PARSE_DOCUMENT の新しいバージョンです。古い関数は引き続きサポートされますが、Snowflakeは新しい関数の使用を推奨します。

AI_PARSE_DOCUMENT の主な機能は次を含みます。

  • 複雑なレイアウトのマスター: 読み込み順とドキュメント階層を維持しながら、複数列の研究論文、財務レポート、技術ドキュメントを正確に処理します。

  • 正確なテーブル抽出: 財務諸表、規制書類、データ量の多い文書からテーブル構造、ヘッダー、関係を維持し、下流の分析に活用します

  • 高度なレイアウト保存 埋め込み画像、プル引用符、複雑なフォーマットなどの混合コンテンツを、コンテキストや意味を失うことなく処理します

詳細については、 AISQL に AI_PARSE_DOCUMENT をご参照ください。