6. März 2025 — Cortex AI PARSE_DOCUMENT-Funktion für OCR – Allgemeine Verfügbarkeit¶
Snowflake freut sich, die allgemeine Verfügbarkeit des OCR-Modus von Snowflake Cortex AI PARSE_DOCUMENT bekannt zu geben, der es Kunden ermöglicht, Text und Daten aus Millionen von Dokumentenseiten präzise zu extrahieren. Diese SQL-Funktion wird vollständig verwaltet und bietet eine OCR-Qualität, die mit der anderer Cloud-Anbieter vergleichbar ist, in Kombination mit der Skalierbarkeit, Leistung und Benutzerfreundlichkeit von Snowflake. PARSE_DOCUMENT OCR extrahiert Textinhalte aus PDF-, DOCX- und PPTX-Dateien, die in einem Snowflake- oder externen Stagingbereich mit SQL gespeichert sind, ohne dass eine komplexe Cloud-Architektur erforderlich ist.
Der Cortex AI PARSE_DOCUMENT OCR-Modus ermöglicht Folgendes:
Textextraktion aus digital erstellten und gescannten Dokumenten.
Hochwertige Extraktion für Dokumente in Englisch, Deutsch, Französisch, Italienisch, Norwegisch, Polnisch, Portugiesisch, Spanisch und Schwedisch.
Nahtlose Integration mit RAG-Pipelines, die Cortex Search antreiben, und mit Cortex AI-Funktionen für die Zusammenfassung von Dokumenten, Übersetzung und Entitätsextraktion.
Automatische Erkennung der Seitenausrichtung.
Weitere Details dazu finden Sie unter Cortex PARSE_DOCUMENT.