ExcelReader¶
Descrição¶
Analisa um documento do Microsoft Excel, retornando cada linha em cada planilha como um registro separado. Esse leitor permite inferir um esquema a partir de todas as planilhas necessárias ou fornecer um esquema explícito para interpretar os valores. Consulte Uso do Controller Service para mais informações na documentação. Esse leitor é capaz de processar documentos do Excel protegidos por senha e não protegidos por senha, como .xlsx (formato de arquivo XSSF 2007 OOXML) e .xls mais antigos (formato de arquivo HSSF “97(-2007)).
Propriedades¶
Na lista abaixo, as propriedades obrigatórias são mostradas com um asterisco (*). Outras propriedades são consideradas opcionais. A tabela também indica os valores padrão e se uma propriedade é compatível com linguagem de expressão NiFi.
Nome de exibição |
Nome da API |
Valor padrão |
Valores permitidos |
Descrição |
---|---|---|---|---|
Formato de data |
Formato de data |
Especifica o formato a ser usado na leitura/gravação de campos de data. Se não for especificado, os campos de data serão assumidos como o número de milissegundos desde a época (meia-noite, 1º de janeiro de 1970 GMT). Se especificado, o valor deve corresponder ao formato Java java.time.format.DateTimeFormatter (por exemplo, MM/dd/yyyyy para um mês de dois dígitos, seguido por um dia de dois dígitos, seguido por um ano de quatro dígitos, todos separados por caracteres “/”, como em 01/01/2017). |
||
Tipo de arquivo de entrada * |
Tipo de arquivo de entrada |
XLSX |
|
Especifica o tipo de arquivo de entrada do Excel. |
Senha * |
Senha |
A senha de uma planilha do Excel protegida por senha |
||
Tipo de proteção * |
Tipo de proteção |
UNPROTECTED |
|
Especifica se uma planilha do Excel está protegida por uma senha ou não. |
Planilhas necessárias |
Planilhas necessárias |
Lista separada por vírgulas de nomes de planilhas de documentos do Excel cujas linhas devem ser extraídas do documento do Excel. Se essa propriedade for deixada em branco, todas as linhas de todas as planilhas serão extraídas do documento do Excel. A lista de nomes diferencia maiúsculas de minúsculas. Todas as planilhas não especificadas nesse valor serão ignoradas. Será gerada uma exceção se a(s) planilha(s) especificada(s) não for(em) encontrada(s). |
||
Linha inicial * |
Linha inicial |
1 |
O número da primeira linha a iniciar o processamento (com base em um). Use essa opção para ignorar as linhas de dados na parte superior de uma planilha que não fazem parte do conjunto de dados. Ao usar a estratégia “Usar linha inicial”, essa deve ser a linha do cabeçalho da coluna. |
|
Formato de hora |
Formato de hora |
Especifica o formato a ser usado na leitura/gravação de campos de tempo. Se não for especificado, os campos de tempo serão assumidos como o número de milissegundos desde a época (meia-noite, 1º de janeiro de 1970 GMT). Se especificado, o valor deve corresponder ao formato Java java.time.format.DateTimeFormatter (por exemplo, HH:mm:ss para uma hora de dois dígitos no formato de 24 horas, seguida por um minuto de dois dígitos, seguido por um segundo de dois dígitos, todos separados pelo caractere “:”, como em 18:04:15). |
||
Formato de carimbo de data/hora |
Formato de carimbo de data/hora |
Especifica o formato a ser usado na leitura/gravação de campos de carimbo de data/hora. Se não for especificado, os campos de carimbo de data/hora serão considerados como o número de milissegundos desde a época (meia-noite, 1º de janeiro de 1970 GMT). Se especificado, o valor deve corresponder ao formato Java java.time.format.DateTimeFormatter (por exemplo, MM/dd/yyyyy HH:mm:ss para um mês de dois dígitos, seguido por um dia de dois dígitos, seguido por um ano de quatro dígitos, todos separados pelo caractere “/”; e depois seguido por uma hora de dois dígitos no formato de 24 horas, seguido por um minuto de dois dígitos, seguido por um segundo de dois dígitos, todos separados pelo caractere “:”, como em 01/01/2017 18:04:15). |
||
Estratégia de acesso ao esquema * |
schema-access-strategy |
Usar a linha inicial |
|
Especifica como obter o esquema que deve ser usado para interpretar os dados. |
Ramificação do esquema |
schema-branch |
Especifica o nome da ramificação a ser usada ao procurar o esquema na propriedade do registro de esquema. Se a propriedade do registro de esquema escolhida não for compatível com a ramificação, esse valor será ignorado. |
||
Nome do esquema |
schema-name |
${schema.name} |
Especifica o nome do esquema a ser pesquisado na propriedade do registro de esquema |
|
Leitor de referência de esquema * |
schema-reference-reader |
Implementação do serviço responsável pela leitura dos atributos ou do conteúdo do FlowFile para determinar o identificador da referência de esquema |
||
Registro de esquema |
schema-registry |
Especifica o Controller Service a ser usado para o registro de esquema |
||
Texto do esquema |
schema-text |
${avro.schema} |
O texto de um esquema formatado por Avro |
|
Versão do esquema |
schema-version |
Especifica a versão do esquema a ser pesquisada no registro de esquema. Se não for especificada, será recuperada a versão mais recente do esquema. |
Gerenciamento do estado¶
Esse componente não armazena o estado.
Restrito¶
Esse componente não é restrito.
Considerações sobre os recursos do sistema¶
Esse componente não especifica considerações sobre os recursos do sistema.