GrokReader¶
Descrição¶
Fornece um mecanismo para ler dados de texto não estruturados, como arquivos de registro, e estruturar os dados para que possam ser processados. O serviço é configurado usando padrões Grok. O serviço lê um fluxo de dados e divide cada mensagem que encontra em um registro separado, cada um contendo os campos configurados. Se uma linha na entrada não corresponder ao padrão de mensagem esperado, a linha de texto será considerada parte da mensagem anterior ou será ignorada, dependendo da configuração, com exceção dos rastreamentos de pilha. Um rastreamento de pilha encontrado no final de uma mensagem de registro é considerado parte da mensagem anterior, mas é adicionado ao campo “stackTrace” do registro. Se um registro não tiver rastreamento de pilha, ele terá um valor NULL para o campo stackTrace (supondo que o esquema inclua, de fato, um campo stackTrace do tipo cadeia de caracteres). Supondo que o esquema inclua um campo “_raw” do tipo cadeia de caracteres, a mensagem bruta será incluída no registro.
Propriedades¶
Na lista abaixo, as propriedades obrigatórias são mostradas com um asterisco (*). Outras propriedades são consideradas opcionais. A tabela também indica os valores padrão e se uma propriedade é compatível com linguagem de expressão NiFi.
Nome de exibição |
Nome da API |
Valor padrão |
Valores permitidos |
Descrição |
---|---|---|---|---|
Expressões Grok * |
Expressão Grok |
Especifica o formato de uma linha de registro no formato Grok. Isso permite que o Record Reader entenda como analisar cada linha de registro. A propriedade oferece suporte a uma ou mais expressões Grok. O leitor tenta analisar as linhas de entrada de acordo com a ordem configurada das expressões. Se uma linha no arquivo de registro não corresponder a nenhuma expressão, será considerado que a linha pertence à mensagem de registro anterior. Se outros padrões Grok forem referenciados por esta expressão, eles deverão ser fornecidos na propriedade Arquivo de padrões Grok. |
||
Padrões Grok |
Arquivo de padrão Grok |
Padrões Grok a serem usados para analisar logs. Se não for especificado, será usado um arquivo padrão interno. Se especificado, todos os padrões especificados substituirão os padrões predefinidos. Consulte os Detalhes adicionais do Controller Service para obter uma lista de padrões predefinidos. |
||
Comportamento sem correspondência * |
no-match-behavior |
append-to-previous-message |
|
Se uma linha de texto for encontrada e não corresponder à expressão Grok fornecida nem fizer parte de um rastreamento de pilha, essa propriedade especificará como o texto deve ser processado. |
Estratégia de acesso ao esquema * |
schema-access-strategy |
string-fields-from-grok-expression |
|
Especifica como obter o esquema que deve ser usado para interpretar os dados. |
Ramificação do esquema |
schema-branch |
Especifica o nome da ramificação a ser usada ao procurar o esquema na propriedade do registro de esquema. Se a propriedade do registro de esquema escolhida não for compatível com a ramificação, esse valor será ignorado. |
||
Nome do esquema |
schema-name |
${schema.name} |
Especifica o nome do esquema a ser pesquisado na propriedade do registro de esquema |
|
Leitor de referência de esquema * |
schema-reference-reader |
Implementação do serviço responsável pela leitura dos atributos ou do conteúdo do FlowFile para determinar o identificador da referência de esquema |
||
Registro de esquema |
schema-registry |
Especifica o Controller Service a ser usado para o registro de esquema |
||
Texto do esquema |
schema-text |
${avro.schema} |
O texto de um esquema formatado por Avro |
|
Versão do esquema |
schema-version |
Especifica a versão do esquema a ser pesquisada no registro de esquema. Se não for especificada, será recuperada a versão mais recente do esquema. |
Gerenciamento do estado¶
Esse componente não armazena o estado.
Restrito¶
Restrições¶
Permissão necessária |
Explicação |
---|---|
recursos remotos de referência |
Padrões e expressões podem fazer referência a recursos HTTP |
Considerações sobre os recursos do sistema¶
Esse componente não especifica considerações sobre os recursos do sistema.