CreateVertexAIEmbeddings 2025.5.31.15¶
Bundle¶
com.snowflake.openflow.runtime | runtime-vertexai-nar
Beschreibung¶
Verwendet VertexAI, um Einbettungen für Text zu erstellen. Der Eingabetext kann als einzelnes FlowFile oder als datensatzorientiertes FlowFile bereitgestellt werden.
Eingabeanforderung¶
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
---|---|
Auto Truncate |
Wenn auf „false“ gesetzt, führt Text, der das Token-Limit überschreitet, zum Fehlschlagen der Anfrage. |
Embeddings Model |
Das für die Einbettungen zu verwendende Modell. Die verfügbaren Modelle sind unter https://cloud.google.com/vertex-ai/generative-ai/docs/learn/models#models aufgeführt. |
Embeddings Record Path |
Der Pfad zu dem Feld im Datensatz, in das die Einbettungen geschrieben werden sollen. |
GCP Credentials Service |
Der Controller Service, der verwendet wird, um Anmeldeinformationen für Google Cloud Platform zu erhalten. |
GCP Location |
Der Speicherort, mit dem der Vertex-Client konfiguriert werden soll |
GCP Project ID |
Die Projekt-ID, mit der der Vertex-Client konfiguriert werden soll |
Max Batch Size |
Die maximale Anzahl von Datensätzen, die in jedem an VertexAI gesendeten Batch enthalten sein dürfen. |
Model Publisher |
Der Herausgeber des Modells |
Output Dimensionality |
Wird verwendet, um die Größe der Ausgabeeinbettung anzugeben. Wenn angegeben, werden die ausgegebenen Einbettungen auf die angegebene Größe gekürzt. |
Record Reader |
Der Record Reade, der zum Lesen von datensatzorientierten Daten verwendet wird. Wenn die eingehenden Daten als Klartext behandelt werden sollen, sollte diese Eigenschaft nicht gesetzt werden. |
Record Writer |
Der Record Writer der zum Schreiben der Ausgabe verwendet wird |
Task Type |
Wird verwendet, um die beabsichtigte nachgelagerte Anwendung von Einbettungen zu übermitteln, damit das Modell die Einbettungen für einen bestimmten Zweck optimieren kann. |
Text Record Path |
Der Pfad zu dem Feld im Datensatz, das den einzubettenden Text enthält. Wenn die eingehenden Daten als Klartext behandelt werden sollen, sollte diese Eigenschaft nicht gesetzt werden. |
Benutzer |
Ein Bezeichner für den Remote-Benutzer, in dessen Namen die Anfrage gestellt wird. |
Beziehungen¶
Name |
Beschreibung |
---|---|
failure |
Das ursprüngliche FlowFile wird an diese Beziehung weitergeleitet, wenn die Einbettungen nicht erstellt werden konnten. |
success |
Die Einbettungen werden an diese Beziehung weitergeleitet. |
Schreibt Attribute¶
Name |
Beschreibung |
---|---|
record.count |
Die Anzahl der Datensätze, die in die Ausgabe geschrieben werden |
mime.type |
Der MIME-Typ der Ausgabedaten, basierend auf dem gewählten Record Writer |
Anwendungsfälle¶
Einbettungen für Text mit dem Einbettungsmodell von VertexAI erstellen |