UpsertPinecone 2025.5.31.15¶
Bundle¶
com.snowflake.openflow.runtime | runtime-pinecone-nar
Beschreibung¶
Veröffentlicht Vektoren, einschließlich Metadaten und optional Text, in einem Pinecone-Index.
Eingabeanforderung¶
REQUIRED
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
---|---|
ID Record Path |
Der Pfad zu dem ID-Feld im Datensatz |
Max Batch Size |
Wenn die Anzahl der Datensätze in einem FlowFile groß ist, kann eine einzige Anfrage an Pinecone erhebliche Mengen an NiFi-Heap verbrauchen. Um dies zu vermeiden, kann die maximale Batchgröße die Anzahl der Datensätze begrenzen, die in einer einzigen Anfrage gesendet werden. Wenn die Anzahl der Datensätze diesen Wert überschreitet, werden mehrere Anfragen an Pinecone gesendet. |
Metadatensat-Pfad |
Der Pfad zum Metadatenfeld im Datensatz |
Pinecone API Key |
Der API-Schlüssel für den Pinecone-Dienst |
Pinecone Index |
Der Name des zu verwendenden Pinecone-Index |
Pinecone Namespace |
Der Name des zu verwendenden Pinecone Namespace |
Record Reader |
Der zum Lesen des FlowFile zu verwendende Record Reader |
Sparse Vector Indices Path |
Wenn Sparse Vectors bereitgestellt werden sollen, verweist dieses RecordPath auf die Indizes der zu verwendenden Sparse-Daten. |
Sparse Vector Values Path |
Wenn Sparse-Vektoren bereitgestellt werden sollen, verweist dieser RecordPath auf die Werte der zu verwendenden Sparse-Daten. |
Textfeldname |
Der Name des Feldes in den Metadaten, das für die Speicherung des mit den Vektoren verbundenen Textes verwendet werden soll. |
Text Record Path |
Der Pfad zu dem Feld im Datensatz, das den mit den Vektoren verbundenen Text enthält. Falls angegeben, wird der Text bei der Veröffentlichung in Pinecone in die Metadaten eingefügt. Wenn Sie nichts angeben, wird der Text nicht an Pinecone gesendet. |
Vector Record Path |
Der Pfad zum Vektorfeld im Datensatz |
Web Client Service |
Der Web Client Service, der für die Kommunikation mit Pinecone verwendet wird |
Beziehungen¶
Name |
Beschreibung |
---|---|
failure |
FlowFiles, die nicht an Pinecone gesendet werden können und bei denen ein erneuter Versuch voraussichtlich nicht erfolgreich sein wird, werden an diese Beziehung weitergeleitet. |
retry |
FlowFiles, die nicht an Pinecone gesendet werden können, für die jedoch ein erneuter Versuch hilfreich sein könnte, werden an diese Beziehung weitergeleitet. |
success |
FlowFiles, die erfolgreich an Pinecone gesendet werden, werden an diese Beziehung weitergeleitet. |
Anwendungsfälle mit anderen Komponenten¶
Erstellt Einbettungen für Rohtextdaten oder Text, der in einem Datensatzfeld wie JSON vorhanden ist, unter Verwendung des OpenAI-Einbettungsmodells und veröffentlicht die Vektoren in Pinecone. |
Fügt Einbettungen für ein Dokument zu einem Pinecone-Index hinzu und ersetzt dabei alle Einbettungen, die bereits für das Dokument existieren. |