Dokumente für Document AI vorbereiten¶
Unter diesem Thema wird beschrieben, wie Sie Ihre Dokumente für die Verwendung mit Document AI vorbereiten.
Die Dokumente, die Sie mit Document AI verarbeiten, müssen die folgenden Anforderungen erfüllen:
Die Dokumente dürfen nicht mehr als 125 Seiten umfassen.
Die Dokumente müssen in einem der folgenden Formate vorliegen:
PDF
PNG
DOCX
EML
JPEG, JPG
HTM, HTML
TEXT, TXT
TIF, TIFF
Die Dokumente dürfen höchstens 50 MB groß sein.
Die Dokumentseiten dürfen höchstens 1.200 × 1.200 mm groß sein.
Die Bilder müssen zwischen 50 × 50 und 10.000 × 10.000 Pixel groß sein.
Stellen Sie zur Verbesserung des Modelltrainings sicher, dass die Dokumente, die Sie auf Document AI hochladen, einen realen Anwendungsfall oder ein reales Szenario darstellen, und dass das Datenset aus unterschiedlichen Dokumenten besteht, sowohl was das Layout als auch was die Daten betrifft.
Sorgen Sie dafür, dass die Informationen in Ihrem Datenset vielfältig sind. Wenn alle Dokumente die gleichen Daten enthalten (z. B. das gleiche Geschlecht oder die gleiche ethnische Zugehörigkeit) oder die Informationen immer in der gleichen Form dargestellt werden (z. B. ein bestimmtes Datumsformat), könnte das Modell falsche Ergebnisse liefern.