ValidateCsv 2025.5.31.15

Pacote

org.apache.nifi | nifi-standard-nar

Descrição

Valida o conteúdo dos FlowFiles ou um valor de atributo do FlowFile em relação a um esquema CSV especificado pelo usuário. Dê uma olhada na documentação adicional desse processador para ver alguns exemplos de esquemas.

Tags

csv, schema, validation

Requisito de entrada

REQUIRED

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

Atributo de origem CSV

O nome do atributo que contém os dados CSV a serem validados. Se essa propriedade estiver em branco, o conteúdo do FlowFile será validado.

validate-csv-delimiter

Caractere usado como “delimitador” nos dados de entrada. Exemplo: ,

validate-csv-eol

Símbolos usados como “fim de linha” nos dados de entrada. Exemplo: n

validate-csv-header

Verdadeiro se o FlowFile de entrada contiver um cabeçalho a ser ignorado; falso caso contrário.

validate-csv-quote

Caractere usado para delimitar entre aspas nos dados de entrada. Exemplo: «

validate-csv-schema

O esquema a ser usado para validação. Espera-se que seja uma cadeia de caracteres delimitados por vírgulas que represente os processadores de células a serem aplicados. Os seguintes processadores de células são permitidos na definição do esquema: [ParseBigDecimal, ParseBool, ParseChar, ParseDate, ParseDouble, ParseInt, ParseLong, Optional, DMinMax, Equals, ForbidSubStr, LMinMax, NotNull, Null, RequireHashCode, RequireSubStr, Strlen, StrMinMax, StrNotNullOrEmpty, StrRegEx, Unique, UniqueHashCode, IsIncludedIn]. Observação: os processadores de célula não podem ser aninhados, exceto com Optional. O esquema é obrigatório se o cabeçalho for falso.

validate-csv-strategy

Estratégia a ser aplicada ao rotear arquivos de entrada para relações de saída.

validate-csv-violations

Se verdadeiro, o atributo validation.error.message incluirá a lista de todas as violações da primeira linha inválida. Observe que definir essa propriedade como verdadeira diminuiria um pouco o desempenho, pois todas as colunas seriam validadas. Se falso, uma linha será inválida assim que for encontrada uma coluna que viole a restrição especificada, e somente essa violação para a primeira linha inválida será incluída no atributo validation.error.message.

Relações

Nome

Descrição

invalid

FlowFiles que não sejam válidos de acordo com o esquema especificado, ou que nenhum esquema ou cabeçalho CSV possa ser identificado, são encaminhados para essa relação

valid

FlowFiles que forem validados com sucesso em relação ao esquema serão encaminhados para essa relação

Grava atributos

Nome

Descrição

count.valid.lines

Se a validação for linha por linha, o número de linhas válidas extraídas dos dados de origem

count.invalid.lines

Se a validação for linha por linha, o número de linhas inválidas extraídas dos dados de origem

count.total.lines

Se a validação for linha por linha, o número total de linhas nos dados de origem

validation.error.message

Para FlowFiles encaminhados para invalid, a mensagem do primeiro erro de validação