ExcelReader¶

Description¶

Analyse un document Microsoft Excel en renvoyant chaque ligne de chaque feuille comme un enregistrement distinct. Ce lecteur permet de déduire un schéma à partir de toutes les feuilles requises ou de fournir un schéma explicite pour interpréter les valeurs. Pour en savoir plus, voir Utilisation du service de contrôleur. Ce lecteur est capable de traiter à la fois les fichiers .xlsx protégés par un mot de passe et non protégés par un mot de passe (format de fichier XSSF 2007 OOXML) et les anciens documents Excel .xls (format de fichier HSSF’97(-2007))

Balises¶

cell, excel, parse, reader, record, row, spreadsheet, values, xls, xlsx

Propriétés¶

Dans la liste ci-dessous, les propriétés requises sont signalées par un astérisque (*). Les autres propriétés sont considérées comme facultatives. La table indique également les valeurs par défaut et précise si une propriété prend en charge le langage d’expression NiFi.


Nom d’affichage	Nom d’API	Valeur par défaut	Valeurs autorisées	Description
Format de date	Format de date			Spécifie le format à utiliser lors de la lecture/écriture des champs de date. S’ils ne sont pas spécifiés, les champs Date seront considérés comme étant le nombre de millisecondes écoulées depuis l’époque (minuit, 1er janvier 1970 GMT). Si elle est spécifiée, la valeur doit correspondre au format Java java.time.format.DateTimeFormatter (par exemple, jj/MM/aaaa pour un mois à deux chiffres, suivi d’un jour à deux chiffres, suivi d’une année à quatre chiffres, tous séparés par des caractères “/”, comme dans 01/01/2017).
Type de fichier d’entrée *	Type de fichier d’entrée	XLSX	XLS XLSX	Spécifie le type de fichier d’entrée Excel.
Mot de passe *	Mot de passe			Le mot de passe d’une feuille de calcul Excel protégée par un mot de passe
Type de protection *	Type de protection	UNPROTECTED	Non protégé Protégé par un mot de passe	Indique si une feuille de calcul Excel est protégée par un mot de passe ou non.
Feuilles requises	Feuilles requises			Liste séparée par des virgules des noms des feuilles du document Excel dont les lignes doivent être extraites du document Excel. Si cette propriété est laissée vide, toutes les lignes de toutes les feuilles seront extraites du document Excel. La liste des noms est sensible à la casse. Toute feuille non spécifiée dans cette valeur sera ignorée. Une exception sera levée si la ou les feuilles spécifiées ne sont pas trouvées.
Stratégie d’évaluation des lignes*	Stratégie d’évaluation des lignes	STANDARD	Standard Toutes les lignes	Stratégie permettant de sélectionner le nombre de lignes après la ligne de départ à utiliser pour déterminer le schéma.
Stratégie d’accès au schéma *	Schema Access Strategy	Utiliser la ligne de départ	Utiliser la propriété Nom du schéma Utiliser la propriété Texte du schéma Lecteur de référence de schéma Utiliser la ligne de départ Déduire le schéma	Indique comment obtenir le schéma à utiliser pour interpréter les données.
Branche du schéma	Branche du schéma			Spécifie le nom de la branche à utiliser lors de la recherche du schéma dans la propriété Schema Registry. Si le registre de schémas choisi ne prend pas en charge la ramification, cette valeur sera ignorée.
Nom de schéma	Nom de schéma	${schema.name}		Spécifie le nom du schéma à rechercher dans la propriété Schema Registry
Lecteur de référence de schéma *	Lecteur de référence de schéma			Mise en œuvre du service responsable de la lecture des attributs ou du contenu de FlowFile pour déterminer l’identifiant de référence du schéma
Registre des schémas	Registre des schémas			Spécifie le Controller Service à utiliser pour le registre des schémas
Texte du schéma	Texte du schéma	${avro.schema}		Le texte d’un schéma formaté par Avro
Version du schéma	Version du schéma			Spécifie la version du schéma à rechercher dans le registre des schémas. Si elle n’est pas spécifiée, c’est la dernière version du schéma qui sera récupérée.
Ligne de départ *	Ligne de départ	1		Le numéro de ligne de la première ligne à commencer à traiter (base 1). Utilisez cette option pour passer les lignes de données en haut d’une feuille de calcul qui ne font pas partie de l’ensemble de données. Si vous utilisez la stratégie Utiliser la ligne de départ, il s’agit de la ligne d’en-tête de la colonne.
Format de l’heure	Format de l’heure			Spécifie le format à utiliser lors de la lecture/écriture des champs Time. S’ils ne sont pas spécifiés, les champs Time seront considérés comme étant le nombre de millisecondes depuis l’époque (minuit, 1er janvier 1970 GMT). Si elle est spécifiée, la valeur doit correspondre au format Java java.time.format.DateTimeFormatter (par exemple, HH:mm:ss pour une heure à deux chiffres au format 24 heures, suivie d’une minute à deux chiffres, suivie d’une seconde à deux chiffres, le tout séparé par des caractères :, comme dans 18:04:15).
Timestamp Format	Timestamp Format			Spécifie le format à utiliser lors de la lecture/écriture des champs horodatage. S’ils ne sont pas spécifiés, les champs d’horodatage seront considérés comme étant le nombre de millisecondes depuis l’époque (minuit, 1er janvier 1970 GMT). Si elle est spécifiée, la valeur doit correspondre au format Java java.time.format.DateTimeFormatter (par exemple, jj/MM/aaaa HH:mm:ss pour un mois à deux chiffres, suivi d’un jour à deux chiffres, suivi d’une année à quatre chiffres, tous séparés par des caractères / ; puis suivi d’une heure à deux chiffres au format 24 heures, suivie d’une minute à deux chiffres, suivie d’une seconde à deux chiffres, tous séparés par des caractères :, comme dans 01/01/2017 18:04:15).

Gestion de l’État¶

Ce composant ne stocke pas d’état.

Restreint¶

Cette composante n’est pas limitée.

Considérations relatives aux ressources du système¶

Ce composant ne précise pas les ressources du système à prendre en compte.