Document AI 를 위한 문서 준비

이 항목에서는 Document AI 를 사용하여 문서를 사용할 수 있도록 준비하는 방법을 설명합니다.

Document AI 로 처리하는 문서는 다음 요구 사항을 충족해야 합니다.

  • 문서의 길이는 125페이지를 넘지 않아야 합니다.

  • 문서는 다음 형식 중 하나여야 합니다.

    • PDF

    • PNG

    • DOCX

    • EML

    • JPEG, JPG

    • HTM, HTML

    • TEXT, TXT

    • TIF, TIFF

  • 문서의 크기는 50MB 이하여야 합니다.

  • 문서 페이지의 크기는 1200 x 1200mm 이하여야 합니다.

  • 이미지는 50 x 50에서 10,000 x 10,000픽셀 사이여야 합니다.

모델 훈련 프로세스를 개선하려면 Document AI 에 업로드하는 문서가 실제 사용 사례 또는 시나리오를 나타내며 데이터 세트가 레이아웃과 데이터 측면에서 다양한 문서로 구성되어 있는지 확인합니다.

데이터 세트에 있는 정보가 다양한지 확인합니다. 모든 문서에 동일한 데이터(예: 동일한 성별 또는 인종)가 포함되어 있거나 정보가 항상 동일한 형식(예: 특정 날짜 형식)으로 표시되는 경우 모델이 잘못된 결과를 제공할 수 있습니다.