UpsertPinecone 2025.5.31.15

번들

com.snowflake.openflow.runtime | runtime-pinecone-nar

설명

메타데이터를 포함한 벡터와 선택적으로 텍스트를 Pinecone 인덱스에 게시합니다.

태그

chatbot, embeddings, gen ai, genai, generative ai, llm, metadata, openflow, pinecone, publish, text, upsert, vector

입력 요구 사항

REQUIRED

민감한 동적 속성 지원

false

속성

속성

설명

ID 레코드 경로

레코드의 ID 필드 경로

Max Batch Size

FlowFile 의 레코드 수가 많은 경우 Pinecone에 한 번의 요청을 생성하면 상당한 양의 NiFi 힙을 소비할 수 있습니다. 이를 방지하기 위해 최대 배치 크기는 한 번의 요청으로 보낼 레코드의 수를 제한할 수 있습니다. 레코드 수가 이 값을 초과하면 여러 요청이 Pinecone으로 전송됩니다.

메타데이터 레코드 경로

레코드의 메타데이터 필드 경로

Pinecone API 키

Pinecone 서비스를 위한 API 키

Pinecone 인덱스

사용할 Pinecone 인덱스의 이름입니다

Pinecone 네임스페이스

사용할 Pinecone 네임스페이스의 이름입니다

Record Reader

FlowFile 을 읽는 데 사용할 Record Reader

스파스 벡터 인덱스 경로

스파스 벡터를 제공해야 하는 경우, 이 RecordPath 는 사용할 스파스 데이터의 인덱스를 가리킵니다.

스파스 벡터 값 경로

스파스 벡터를 제공해야 하는 경우, 이 RecordPath 는 사용할 스파스 데이터의 값을 가리킵니다.

텍스트 필드 이름

벡터와 연관된 텍스트를 저장하는 데 사용할 메타데이터의 필드 이름입니다.

Text Record Path

벡터와 연관된 텍스트가 포함된 레코드의 필드 경로입니다. 이 옵션을 지정하면 Pinecone에 게시할 때 메타데이터에 텍스트가 삽입됩니다. 지정하지 않으면 텍스트가 Pinecone으로 전송되지 않습니다.

벡터 레코드 경로

레코드의 벡터 필드 경로

Web Client Service

Pinecone과의 통신에 사용할 웹 클라이언트 서비스입니다

관계

이름

설명

실패

FlowFiles 로 보낼 수 없고 재시도가 성공할 것으로 예상되지 않는 경우 이 관계로 라우팅됩니다

retry

FlowFiles 로 보내지 못했지만 재시도가 도움이 될 수 있는 경우 이 관계로 라우팅됩니다

성공

FlowFiles 로 성공적으로 전송된 요청은 이 관계로 라우팅됩니다

다른 구성 요소가 포함된 사용 사례

OpenAI 의 임베딩 모델을 사용하여 원시 텍스트 데이터 또는 JSON 과 같은 레코드 필드에 존재하는 텍스트에 대한 임베딩을 생성하고 벡터를 Pinecone에 게시합니다.

문서에 대한 임베딩을 Pinecone 인덱스에 추가하여 문서에 이미 존재하는 임베딩을 모두 바꿉니다.

참고 항목