Préparez vos documents pour Document AI

Cette rubrique décrit comment préparer vos documents en vue de leur utilisation avec Document AI.

Les documents que vous traitez avec Document AI doivent répondre aux exigences suivantes :

  • Les documents ne doivent pas dépasser 125 pages.

  • Les documents doivent être présentés dans l’un des formats suivants :

    • PDF

    • PNG

    • DOCX

    • EML

    • JPEG, JPG

    • HTM, HTML

    • TEXT, TXT

    • TIF, TIFF

  • Les documents doivent être d’une taille inférieure ou égale à 50 MB.

  • Les pages du document doivent avoir des dimensions inférieures ou égales à 1200 x 1200 mm.

  • Les images doivent avoir une taille comprise entre 50 x 50 et 10 000 x 10 000 pixels.

Pour améliorer le processus d’entraînement des modèles, assurez-vous que les documents que vous chargez sur Document AI représentent un cas d’utilisation ou un scénario réel et que l’ensemble de données est constitué de documents divers en termes de mise en page et de données.

Veillez à ce que les informations contenues dans votre ensemble de données soient variées. Si tous les documents contiennent les mêmes données (par exemple, le même sexe ou la même origine ethnique), ou si les informations sont toujours présentées sous la même forme (par exemple, un format de date spécifique), le modèle pourrait fournir des résultats incorrects.