06 mars 2025 — Fonction Cortex AI PARSE_DOCUMENT pour OCR – Disponibilité générale

Snowflake a le plaisir d’annoncer la disponibilité générale du mode OCR de Snowflake Cortex AI PARSE_DOCUMENT, qui permet aux clients d’extraire avec précision du texte et des données à partir de millions de pages de documents. Cette fonction SQL est entièrement gérée et offre une qualité OCR comparable à celle d’autres fournisseurs de Cloud, associée à l’évolutivité, aux performances et à la facilité d’utilisation de Snowflake. PARSE_DOCUMENT OCR extrait le contenu textuel des fichiers PDF, DOCX et PPTX stockés dans une zone de préparation externe ou Snowflake à l’aide de SQL, sans nécessiter d’architecture Cloud complexe.

Le mode OCR de Cortex AI PARSE_DOCUMENT permet :

  • Extraction de texte à partir de documents numérisés ou scannés.

  • Extraction de haute qualité pour les documents en anglais, allemand, français, italien, norvégien, polonais, portugais, espagnol et suédois.

  • Intégration transparente avec les pipelines RAG qui alimentent Cortex Search, et avec les fonctions Cortex AI pour le résumé de documents, la traduction et l’extraction d’entités.

  • Détection automatique de l’orientation de la page.

Pour plus de détails, voir Cortex PARSE_DOCUMENT.