GrokReader¶
Description¶
Fournit un mécanisme permettant de lire des données textuelles non structurées, telles que des fichiers de connexion, et de structurer les données afin qu’elles puissent être traitées. Le service est configuré à l’aide de modèles Grok. Le service lit un flux de données et divise chaque message qu’il trouve en un enregistrement distinct, chacun contenant les champs configurés. Si une ligne de l’entrée ne correspond pas au modèle de message attendu, la ligne de texte est soit considérée comme faisant partie du message précédent, soit sautée, en fonction de la configuration, à l’exception des traces de pile. Une trace de pile qui se trouve à la fin d’un message de connexion est considérée comme faisant partie du message précédent mais est ajoutée au champ « stackTrace » de l’enregistrement. Si un enregistrement n’a pas de trace de pile, il aura une valeur NULL pour le champ stackTrace (en supposant que le schéma comprenne en fait un champ stackTrace de type String). Si le schéma comprend un champ « _raw » de type « String », le message brut sera inclus dans l’enregistrement.
Propriétés¶
Dans la liste ci-dessous, les propriétés requises sont signalées par un astérisque (*). Les autres propriétés sont considérées comme facultatives. La table indique également les valeurs par défaut et précise si une propriété prend en charge le langage d’expression NiFi.
Nom d’affichage |
Nom d’API |
Valeur par défaut |
Valeurs autorisées |
Description |
---|---|---|---|---|
Expressions Grok * |
Expression Grok |
Spécifie le format d’une ligne de connexion au format Grok. Cela permet au Record Reader de comprendre comment analyser chaque ligne de connexion. La propriété prend en charge une ou plusieurs expressions Grok. Le lecteur tente d’analyser les lignes d’entrée selon l’ordre configuré des expressions.Si une ligne du fichier journal ne correspond à aucune expression, la ligne sera supposée appartenir au message de journal précédent. Si d’autres modèles Grok sont référencés par cette expression, ils doivent être fournis dans la propriété Grok Pattern File (Fichier de modèles Grok). |
||
Les modèles Grok |
Fichier de modèles Grok |
Modèles Grok à utiliser pour connecter les logs. S’il n’est pas spécifié, un fichier de modèles par défaut sera utilisé. Si vous le précisez, tous les modèles spécifiés remplaceront les modèles par défaut. Consultez les détails supplémentaires du Controller Service pour obtenir la liste des modèles prédéfinis. |
||
Comportement d’absence de correspondance * |
no-match-behavior |
append-to-previous-message |
|
Si une ligne de texte est rencontrée et qu’elle ne correspond pas à l’expression Grok donnée, et qu’elle ne fait pas partie d’un traçage de pile, cette propriété spécifie comment le texte doit être traité. |
Stratégie d’accès au schéma * |
schema-access-strategy |
string-fields-from-grok-expression |
|
Indique comment obtenir le schéma à utiliser pour interpréter les données. |
Branche du schéma |
schema-branch |
Spécifie le nom de la branche à utiliser lors de la recherche du schéma dans la propriété Schema Registry. Si le registre de schémas choisi ne prend pas en charge la ramification, cette valeur sera ignorée. |
||
Nom de schéma |
schema-name |
${schema.name} |
Spécifie le nom du schéma à rechercher dans la propriété Schema Registry |
|
Lecteur de référence de schéma * |
schema-reference-reader |
Mise en œuvre du service responsable de la lecture des attributs ou du contenu de FlowFile pour déterminer l’identifiant de référence du schéma |
||
Registre des schémas |
schema-registry |
Spécifie le Controller Service à utiliser pour le registre des schémas |
||
Texte du schéma |
schema-text |
${avro.schema} |
Le texte d’un schéma formaté par Avro |
|
Version du schéma |
schema-version |
Spécifie la version du schéma à rechercher dans le registre des schémas. Si elle n’est pas spécifiée, c’est la dernière version du schéma qui sera récupérée. |
Gestion de l’État¶
Ce composant ne stocke pas d’état.
Restreint¶
Restrictions¶
Autorisation requise |
Explication |
---|---|
reference remote resources |
Les modèles et les expressions peuvent faire référence à des ressources sur HTTP |
Considérations relatives aux ressources du système¶
Ce composant ne précise pas les ressources du système à prendre en compte.