06 de março de 2025 — Função Cortex AI PARSE_DOCUMENT para OCR – Disponibilidade geral¶
A Snowflake tem o prazer de anunciar a disponibilidade geral do modo OCR do Snowflake Cortex AI PARSE_DOCUMENT, que permite aos clientes extrair com precisão textos e dados de milhões de páginas de documentos. Essa função do SQL é totalmente gerenciada, oferecendo a qualidade do OCR no mesmo nível de outros provedores de nuvem, combinada com a escalabilidade, o desempenho e a facilidade de uso do Snowflake. PARSE_DOCUMENT OCR extrai o conteúdo de texto dos arquivos PDF, DOCX e PPTX armazenados em um estágio do Snowflake ou externo usando SQL, sem exigir uma arquitetura de nuvem complexa.
O modo Cortex AI PARSE_DOCUMENT OCR habilita:
Extração de texto de documentos digitalizados e escaneados.
Extração de alta qualidade para documentos em inglês, alemão, francês, italiano, norueguês, polonês, português, espanhol e sueco.
Integração perfeita com os pipelines RAG que alimentam o Cortex Search e com o Cortex AI Functions para resumo de documentos, tradução e extração de entidades.
Detecção automática da orientação da página.
Para obter mais detalhes, consulte Cortex PARSE_DOCUMENT.