ExcelReader¶

Descrição¶

Analisa um documento do Microsoft Excel retornando cada linha em cada planilha como um registro separado. Esse leitor permite inferir um esquema de todas as planilhas necessárias ou fornecer um esquema explícito para interpretar os valores. Consulte Uso do Controller Service para obter mais documentação. Esse leitor é capaz de processar documentos do Excel .xlsx protegidos por senha ou não (formato de arquivo XSSF 2007 OOXML) e .xls mais antigos (formato de arquivo HSSF’97(-2007)).

Tags¶

cell, excel, parse, reader, record, row, spreadsheet, values, xls, xlsx

Propriedades¶

Na lista abaixo, as propriedades obrigatórias são mostradas com um asterisco (*). Outras propriedades são consideradas opcionais. A tabela também indica os valores padrão e se uma propriedade é compatível com linguagem de expressão NiFi.


Nome de exibição	Nome da API	Valor padrão	Valores permitidos	Descrição
Formato de data	Formato de data			Especifica o formato a ser usado na leitura/gravação de campos de data. Se não for especificado, os campos de data serão assumidos como o número de milissegundos desde a época (meia-noite, 1º de janeiro de 1970 GMT). Se especificado, o valor deve corresponder ao formato Java java.time.format.DateTimeFormatter (por exemplo, MM/dd/yyyyy para um mês de dois dígitos, seguido por um dia de dois dígitos, seguido por um ano de quatro dígitos, todos separados por caracteres “/”, como em 01/01/2017).
Tipo de arquivo de entrada *	Tipo de arquivo de entrada	XLSX	XLS XLSX	Especifica o tipo de arquivo de entrada do Excel.
Senha *	Senha			A senha de uma planilha do Excel protegida por senha
Tipo de proteção *	Tipo de proteção	UNPROTECTED	Sem proteção Protegido por senha	Especifica se uma planilha do Excel está protegida por uma senha ou não.
Planilhas necessárias	Planilhas necessárias			Lista separada por vírgulas de nomes de planilhas de documentos do Excel cujas linhas devem ser extraídas do documento do Excel. Se essa propriedade for deixada em branco, todas as linhas de todas as planilhas serão extraídas do documento do Excel. A lista de nomes diferencia maiúsculas de minúsculas. Todas as planilhas não especificadas nesse valor serão ignoradas. Será gerada uma exceção se a(s) planilha(s) especificada(s) não for(em) encontrada(s).
Estratégia de avaliação de linhas *	Estratégia de avaliação de linhas	STANDARD	Padrão Todas as linhas	Uma estratégia para selecionar quantas linhas após a linha inicial devem ser usadas para determinar o esquema.
Estratégia de acesso ao esquema *	Schema Access Strategy	Usar a linha inicial	Usar a propriedade “Schema Name” Use a propriedade “Schema Text” Leitor de referência de esquema Usar a linha inicial Inferir o esquema	Especifica como obter o esquema que deve ser usado para interpretar os dados.
Ramificação do esquema	Ramificação do esquema			Especifica o nome da ramificação a ser usada ao procurar o esquema na propriedade do registro de esquema. Se a propriedade do registro de esquema escolhida não for compatível com a ramificação, esse valor será ignorado.
Nome do esquema	Nome do esquema	${schema.name}		Especifica o nome do esquema a ser pesquisado na propriedade do registro de esquema
Leitor de referência de esquema *	Leitor de referência de esquema			Implementação do serviço responsável pela leitura dos atributos ou do conteúdo do FlowFile para determinar o identificador da referência de esquema
Registro de esquema	Registro de esquema			Especifica o Controller Service a ser usado para o registro de esquema
Texto do esquema	Texto do esquema	${avro.schema}		O texto de um esquema formatado por Avro
Versão do esquema	Versão do esquema			Especifica a versão do esquema a ser pesquisada no registro de esquema. Se não for especificada, será recuperada a versão mais recente do esquema.
Linha inicial *	Linha inicial	1		O número da primeira linha a iniciar o processamento (com base em um). Use essa opção para ignorar as linhas de dados na parte superior de uma planilha que não fazem parte do conjunto de dados. Ao usar a estratégia “Usar linha inicial”, essa deve ser a linha do cabeçalho da coluna.
Formato de hora	Formato de hora			Especifica o formato a ser usado na leitura/gravação de campos de tempo. Se não for especificado, os campos de tempo serão assumidos como o número de milissegundos desde a época (meia-noite, 1º de janeiro de 1970 GMT). Se especificado, o valor deve corresponder ao formato Java java.time.format.DateTimeFormatter (por exemplo, HH:mm:ss para uma hora de dois dígitos no formato de 24 horas, seguida por um minuto de dois dígitos, seguido por um segundo de dois dígitos, todos separados pelo caractere “:”, como em 18:04:15).
Formato de carimbo de data/hora	Formato de carimbo de data/hora			Especifica o formato a ser usado na leitura/gravação de campos de carimbo de data/hora. Se não for especificado, os campos de carimbo de data/hora serão considerados como o número de milissegundos desde a época (meia-noite, 1º de janeiro de 1970 GMT). Se especificado, o valor deve corresponder ao formato Java java.time.format.DateTimeFormatter (por exemplo, MM/dd/yyyyy HH:mm:ss para um mês de dois dígitos, seguido por um dia de dois dígitos, seguido por um ano de quatro dígitos, todos separados pelo caractere “/”; e depois seguido por uma hora de dois dígitos no formato de 24 horas, seguido por um minuto de dois dígitos, seguido por um segundo de dois dígitos, todos separados pelo caractere “:”, como em 01/01/2017 18:04:15).

Gerenciamento do estado¶

Esse componente não armazena o estado.

Restrito¶

Esse componente não é restrito.

Considerações sobre os recursos do sistema¶

Esse componente não especifica considerações sobre os recursos do sistema.