Document AI 를 위한 문서 준비¶
이 항목에서는 Document AI 를 사용하여 문서를 사용할 수 있도록 준비하는 방법을 설명합니다.
Document AI 로 처리하는 문서는 다음 요구 사항을 충족해야 합니다.
- 문서의 길이는 125페이지를 넘지 않아야 합니다. 
- 문서는 다음 형식 중 하나여야 합니다. - PDF 
- PNG 
- DOCX 
- EML 
- JPEG, JPG 
- HTM, HTML 
- TEXT, TXT 
- TIF, TIFF 
 
- 문서의 크기는 50MB 이하여야 합니다. 
- 문서 페이지의 크기는 1200 x 1200mm 이하여야 합니다. 
- 이미지는 50 x 50에서 10,000 x 10,000픽셀 사이여야 합니다. 
모델 훈련 프로세스를 개선하려면 Document AI 에 업로드하는 문서가 실제 사용 사례 또는 시나리오를 나타내며 데이터 세트가 레이아웃과 데이터 측면에서 다양한 문서로 구성되어 있는지 확인합니다.
데이터 세트에 있는 정보가 다양한지 확인합니다. 모든 문서에 동일한 데이터(예: 동일한 성별 또는 인종)가 포함되어 있거나 정보가 항상 동일한 형식(예: 특정 날짜 형식)으로 표시되는 경우 모델이 잘못된 결과를 제공할 수 있습니다.