UpsertPinecone 2025.5.31.15

Bundle

com.snowflake.openflow.runtime | runtime-pinecone-nar

Beschreibung

Veröffentlicht Vektoren, einschließlich Metadaten und optional Text, in einem Pinecone-Index.

Tags

chatbot, embeddings, gen ai, genai, generative ai, llm, metadata, openflow, pinecone, publish, text, upsert, vector

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

ID Record Path

Der Pfad zu dem ID-Feld im Datensatz

Max Batch Size

Wenn die Anzahl der Datensätze in einem FlowFile groß ist, kann eine einzige Anfrage an Pinecone erhebliche Mengen an NiFi-Heap verbrauchen. Um dies zu vermeiden, kann die maximale Batchgröße die Anzahl der Datensätze begrenzen, die in einer einzigen Anfrage gesendet werden. Wenn die Anzahl der Datensätze diesen Wert überschreitet, werden mehrere Anfragen an Pinecone gesendet.

Metadatensat-Pfad

Der Pfad zum Metadatenfeld im Datensatz

Pinecone API Key

Der API-Schlüssel für den Pinecone-Dienst

Pinecone Index

Der Name des zu verwendenden Pinecone-Index

Pinecone Namespace

Der Name des zu verwendenden Pinecone Namespace

Record Reader

Der zum Lesen des FlowFile zu verwendende Record Reader

Sparse Vector Indices Path

Wenn Sparse Vectors bereitgestellt werden sollen, verweist dieses RecordPath auf die Indizes der zu verwendenden Sparse-Daten.

Sparse Vector Values Path

Wenn Sparse-Vektoren bereitgestellt werden sollen, verweist dieser RecordPath auf die Werte der zu verwendenden Sparse-Daten.

Textfeldname

Der Name des Feldes in den Metadaten, das für die Speicherung des mit den Vektoren verbundenen Textes verwendet werden soll.

Text Record Path

Der Pfad zu dem Feld im Datensatz, das den mit den Vektoren verbundenen Text enthält. Falls angegeben, wird der Text bei der Veröffentlichung in Pinecone in die Metadaten eingefügt. Wenn Sie nichts angeben, wird der Text nicht an Pinecone gesendet.

Vector Record Path

Der Pfad zum Vektorfeld im Datensatz

Web Client Service

Der Web Client Service, der für die Kommunikation mit Pinecone verwendet wird

Beziehungen

Name

Beschreibung

failure

FlowFiles, die nicht an Pinecone gesendet werden können und bei denen ein erneuter Versuch voraussichtlich nicht erfolgreich sein wird, werden an diese Beziehung weitergeleitet.

retry

FlowFiles, die nicht an Pinecone gesendet werden können, für die jedoch ein erneuter Versuch hilfreich sein könnte, werden an diese Beziehung weitergeleitet.

success

FlowFiles, die erfolgreich an Pinecone gesendet werden, werden an diese Beziehung weitergeleitet.

Anwendungsfälle mit anderen Komponenten

Erstellt Einbettungen für Rohtextdaten oder Text, der in einem Datensatzfeld wie JSON vorhanden ist, unter Verwendung des OpenAI-Einbettungsmodells und veröffentlicht die Vektoren in Pinecone.

Fügt Einbettungen für ein Dokument zu einem Pinecone-Index hinzu und ersetzt dabei alle Einbettungen, die bereits für das Dokument existieren.

Siehe auch: