2025년 3 월 06 일 — OCR 용 Cortex AI PARSE_DOCUMENT 함수 – 일반 공급

Snowflake는 고객이 수백만 개의 문서 페이지에서 텍스트와 데이터를 정확하게 추출할 수 있는 Snowflake Cortex AI PARSE_DOCUMENT 의OCR 모드를 일반 공급으로 제공합니다. 이 SQL 함수는 완전 관리형이며, 다른 클라우드 공급자와 동등한 OCR 품질과 함께 Snowflake의 확장성, 성능 및 사용 편의성을 제공합니다. PARSE_DOCUMENT OCR 은 복잡한 클라우드 아키텍처 없이도 SQL 을 사용하여 Snowflake 또는 외부 스테이지에 저장된 PDF, DOCX, PPTX 파일에서 텍스트 내용을 추출합니다.

Cortex AI PARSE_DOCUMENT OCR 모드를 통해 다음을 할 수 있습니다.

  • 디지털로 생성된 문서와 스캔한 문서 모두에서 텍스트 추출.

  • 영어, 독일어, 프랑스어, 이탈리아어, 노르웨이어, 폴란드어, 포르투갈어, 스페인어, 스웨덴어로 된 문서를 위한 고품질 추출.

  • Cortex Search를 지원하는 RAG 파이프라인 및 문서 요약, 변환 및 엔터티 추출을 위한 Cortex AI 함수와 원활하게 통합됩니다.

  • 페이지 방향 자동 감지.

자세한 내용은 Cortex PARSE_DOCUMENT 섹션을 참조하십시오.