ConsumeTwitter 2025.5.31.15

번들

org.apache.nifi | nifi-social-media-nar

설명

Twitter의 스트림 API v2에서 트윗을 스트리밍합니다. 스트림은 이전에 업로드한 규칙에 따라 샘플 스트림 또는 검색 스트림을 제공합니다. 또한 이 프로세서는 트윗의 특정 필드를 응답의 일부로 반환할 수 있는 패스스루를 제공합니다. 트윗 오브젝트 모델링에 대한 자세한 내용은 https://developer.twitter.com/en/docs/twitter-api/data-dictionary/introduction을 참조하십시오.

태그

json, social media, status, tweets, twitter

입력 요구 사항

FORBIDDEN

민감한 동적 속성 지원

false

속성

속성

설명

backfill-minutes

연결 해제 후 요청할 스트림 데이터의 시간(최대 5분)입니다. 학술 연구 액세스 권한이 있는 프로젝트에만 사용할 수 있습니다. Https://developer.twitter.com/en/docs/twitter-api/tweets/filtered-stream/integrate/recovery-and-redundancy-features 참조

backoff-attempts

어떤 이유로든 스트림 연결이 끊어진 경우 예외를 throw하기 전에 프로세서가 시도하는 재연결 시도 횟수입니다. 이 예외가 발생하고 연결이 수정된 후 스트림을 시작하려면 프로세서를 중지했다가 다시 시작하십시오. 이 속성의 값이 0이면 백오프가 발생하지 않으며 스트림이 실패하면 항상 프로세서를 다시 시작해야 합니다.

backoff-time

현재 스트림이 어떤 이유로든 실패할 경우 새 스트림을 요청하기 전에 백오프할 기간입니다. 재시작에 실패할 때마다 2씩 증가합니다

base-path

프로세서가 HTTP 요청을 할 때 사용할 기본 경로입니다. 기본값은 대부분의 사용 사례에 충분합니다.

batch-size

단일 FlowFile 에 작성될 수 있는 트윗의 최대 개수. 프로세서 호출 시 큐에 있는 사용 가능한 트윗 수에 따라 더 적은 수의 트윗을 작성합니다.

bearer-token

Twitter에서 제공하는 무기명 토큰입니다.

connect-timeout

시간 초과 전에 클라이언트가 Twitter API 와 연결을 설정해야 하는 최대 시간입니다. 값을 0으로 설정하면 연결 시간 제한이 비활성화됩니다.

expansions

반환된 트윗의 오브젝트에 대한 쉼표로 구분된 확장자 목록입니다. 올바른 사용법은 https://developer.twitter.com/en/docs/twitter-api/expansions을 참조하십시오. 가능한 필드 값: author_id, referenced_tweets.id, referenced_tweets.id.author_id, entities.mentions.username, attachments.poll_ids, attachments.media_keys ,in_reply_to_user_id, geo.place_id

maximum-backoff-time

새 스트림 시도를 시작하기 위해 백오프할 최대 기간으로, 이 값은 ‘Backoff Time’ 속성보다 훨씬 높게 설정하는 것이 좋습니다

media-fields

트윗의 일부로 반환할 media 필드의 쉼표로 구분된 목록입니다. 올바른 사용법은 https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/media를 참조하십시오. 사용 가능한 필드 값은 alt_text, duration_ms, height, media_key, non_public_metrics, organic_metrics, preview_image_url, promoted_metrics, public_metrics, type, url, width입니다.

place-fields

트윗의 일부로 반환할 place 필드의 쉼표로 구분된 목록입니다. 올바른 사용법은 https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/place를 참조하십시오. 가능한 필드 값은 contained_within, country, country_code, full_name, geo, id, name, place_type입니다.

poll-fields

트윗의 일부로 반환할 poll 필드의 쉼표로 구분된 목록입니다. 올바른 사용법은 https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/poll을 참조하십시오. 가능한 필드 값은 duration_minutes, end_datetime, id, options, voting_status입니다.

queue-size

스트림된 메시지에 대한 내부 큐의 최대 크기

read-timeout

시간 제한이 적용되기 전까지 API 를 통해 Twitter에서 트윗을 받지 않은 최대 비활성 시간입니다. 값을 0으로 설정하면 읽기 시간 제한이 비활성화됩니다.

stream-endpoint

프로세서가 트윗을 소비할 소스입니다.

tweet-fields

트윗의 일부로 반환할 tweet 필드의 쉼표로 구분된 목록입니다. 올바른 사용법은 https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/tweet을 참조하십시오. 가능한 필드 값: attachments, author_id, context_annotations, conversation_id, created_at, entities, geo, id, in_reply_to_user_id, lang, non_public_metrics, organic_metrics, possibly_sensitive, promoted_metrics, public_metrics, referenced_tweets, reply_settings, source, text, withheld

user-fields

트윗의 일부로 반환할 user 필드의 쉼표로 구분된 목록입니다. 올바른 사용법은 https://developer.twitter.com/en/docs/twitter-api/data-dictionary/object-model/user를 참조하십시오. 가능한 필드 값: created_at, description, entities, id, location, name, pinned_tweet_id, profile_image_url, protected, public_metrics, url, username, verified, withheld

관계

이름

설명

성공

1개 이상의 트윗 배열을 포함한 FlowFiles

Writes 특성

이름

설명

mime.type

application/json으로 설정된 MIME 유형

tweets

FlowFile 의 트윗 수