06 mars 2025 — Fonction Cortex AI PARSE_DOCUMENT pour OCR – Disponibilité générale¶
Snowflake a le plaisir d’annoncer la disponibilité générale du mode OCR de Snowflake Cortex AI PARSE_DOCUMENT, qui permet aux clients d’extraire avec précision du texte et des données à partir de millions de pages de documents. Cette fonction SQL est entièrement gérée et offre une qualité OCR comparable à celle d’autres fournisseurs de Cloud, associée à l’évolutivité, aux performances et à la facilité d’utilisation de Snowflake. PARSE_DOCUMENT OCR extrait le contenu textuel des fichiers PDF, DOCX et PPTX stockés dans une zone de préparation externe ou Snowflake à l’aide de SQL, sans nécessiter d’architecture Cloud complexe.
Le mode OCR de Cortex AI PARSE_DOCUMENT permet :
Extraction de texte à partir de documents numérisés ou scannés.
Extraction de haute qualité pour les documents en anglais, allemand, français, italien, norvégien, polonais, portugais, espagnol et suédois.
Intégration transparente avec les pipelines RAG qui alimentent Cortex Search, et avec les fonctions Cortex AI pour le résumé de documents, la traduction et l’extraction d’entités.
Détection automatique de l’orientation de la page.
Pour plus de détails, voir Cortex PARSE_DOCUMENT.