GrokReader

설명

로그 파일과 같은 비정형 텍스트 데이터를 읽고 처리할 수 있도록 데이터를 구조화하기 위한 메커니즘을 제공합니다. 서비스는 Grok 패턴을 사용하여 구성됩니다. 이 서비스는 데이터 스트림에서 읽고 찾은 각 메시지를 별도의 레코드로 분할하며, 각 레코드에는 구성된 필드가 포함됩니다. 입력된 텍스트 라인이 예상 메시지 패턴과 일치하지 않으면 스택 추적을 제외하고 구성에 따라 해당 텍스트 라인이 이전 메시지의 일부로 간주되거나 건너뛰게 됩니다. 로그 메시지의 끝에서 발견되는 스택 추적은 이전 메시지의 일부로 간주되지만 레코드의 ‘stackTrace’ 필드에 추가됩니다. 레코드에 스택 추적이 없는 경우 stackTrace 필드에 NULL 값을 갖습니다(스키마에 실제로 문자열 유형의 stackTrace 필드가 포함되어 있다고 가정). 스키마에 문자열 유형의 ‘_raw’ 필드가 포함되어 있다고 가정하면 원시 메시지가 레코드에 포함됩니다.

태그

grok, logfiles, logs, logstash, parse, pattern, reader, record, regex, text, unstructured

속성

아래 목록에서 필수 속성에는 별표(*)가 표시되어 있습니다. 다른 속성은 선택 사항으로 간주됩니다. 이 테이블에는 기본값과 속성이 NiFi 식 언어를 지원하는지 여부도 표시됩니다.

표시 이름

API 이름

기본값

허용되는 값

설명

Grok 식 *

Grok Expression

로그 줄의 형식을 Grok 형식으로 지정합니다. 이를 통해 Record Reader는 각 로그 행을 구문 분석하는 방법을 이해할 수 있습니다. 이 속성은 1개 이상의 Grok 식을 지원합니다. 리더는 구성된 식의 순서에 따라 입력 줄을 구문 분석하려고 시도합니다. 로그 파일의 줄이 식과 일치하지 않으면 해당 줄은 이전 로그 메시지에 속한 것으로 간주됩니다. 이 식에서 다른 Grok 패턴을 참조하는 경우, Grok Pattern File 속성에 해당 패턴을 제공해야 합니다.

Grok 패턴

Grok 패턴 파일

로그 구문 분석에 사용할 Grok 패턴. 지정하지 않으면 기본 제공 기본 패턴 파일이 사용됩니다. 지정하면 지정된 모든 패턴이 기본 패턴을 재정의합니다. 사전 정의된 패턴 목록은 컨트롤러 서비스의 추가 세부 정보를 참조하십시오.

일치 동작 없음 *

no-match-behavior

append-to-previous-message

  • 이전 메시지에 추가하기

  • 라인 건너뛰기

  • 원시 라인

텍스트 라인이 발견되었는데 지정된 Grok 식과 일치하지 않고 스택 추적의 일부가 아닌 경우, 이 속성은 텍스트 처리 방법을 지정합니다.

Schema Access Strategy *

schema-access-strategy

string-fields-from-grok-expression

  • Grok 식에서 문자열 필드 사용

  • ‘Schema Name’ 속성 사용

  • ‘Schema Text’ 속성 사용

  • Schema Reference Reader

데이터 해석에 사용할 스키마를 가져오는 방법을 지정합니다.

Schema Branch

schema-branch

Schema Registry 속성에서 스키마를 조회할 때 사용할 분기의 이름을 지정합니다. 선택한 Schema Registry가 분기를 지원하지 않는 경우 이 값은 무시됩니다.

Schema Name

schema-name

${schema.name}

Schema Registry 속성에서 조회할 스키마의 이름을 지정합니다

Schema Reference Reader *

schema-reference-reader

스키마 참조 식별자를 결정하기 위해 FlowFile 특성 또는 내용을 읽는 역할을 담당하는 서비스 구현

Schema Registry

schema-registry

Schema Registry에 사용할 컨트롤러 서비스를 지정합니다

Schema Text

schema-text

${avro.schema}

Avro 형식의 스키마 텍스트

Schema Version

schema-version

Schema Registry에서 조회할 스키마 버전을 지정합니다. 지정하지 않으면 최신 버전의 스키마가 검색됩니다.

상태 관리

이 구성 요소는 상태를 저장하지 않습니다.

제한됨

제한 사항

필수 권한

설명

reference remote resources

HTTP 에서의 패턴과 식은 다음과 같은 리소스를 참조할 수 있습니다

시스템 리소스 고려 사항

이 구성 요소는 시스템 리소스 고려 사항을 지정하지 않습니다.