Alle Prozessoren (alphabetisch)

Unter diesem Thema finden Sie eine Liste aller Snowflake Openflow-Prozessoren in alphabetischer Reihenfolge. Die Liste beinhaltet:

  • Der Name des jeweiligen Prozessors

  • Eine Zusammenfassung zu jedem Prozessor

A

Prozessor

Beschreibung

Snowflake

AbortQueryJob

Bricht eine Abfrage in Salesforce mit der Bulk-API 2 ab.

AttributesToCSV

Erstellt eine CSV-Darstellung der Attribute des Eingabe-FlowFile.

AttributesToJSON

Erstellt eine JSON-Darstellung der Attribute des Eingabe-FlowFile.

C

Prozessor

Beschreibung

CalculateRecordStats

Zählt die Anzahl der Datensätze in einer Datensatzgruppe, optional auch die Anzahl der Elemente pro Kategorie, wobei die Kategorien durch benutzerdefinierte Eigenschaften definiert sind.

Snowflake

CaptureChangeMySQL

Liest CDC-Ereignisse aus einer MySQL-Datenbank.

Snowflake

CaptureChangePostgreSQL

Liest CDC-Ereignisse aus einer PostgreSQL-Datenbank.

Snowflake

CaptureChangeSqlServer

Liest CDC-Ereignisse aus einer SQL-Server-Datenbank.

Snowflake

CaptureGoogleDriveChanges

Erfasst Änderungen an einem Shared Google Drive und sendet für jede Änderung ein FlowFile.

Snowflake

CaptureMicrosoft365GroupsChanges

Erfasst Änderungen an Microsoft365-Gruppen und sendet für jede Änderung ein FlowFile.

Snowflake

CaptureSharepointChanges

Erfasst Änderungen in einer SharePoint-Dokumentbibliothek und sendet für jede Änderung ein FlowFile.

Snowflake

CheckMetaAdsReportReadiness

Prozessor, der prüft, ob der Meta Ads-Bericht zum Download bereit ist.

Snowflake

ChunkRecordText

Teilt Text mit Optionen für die rekursive Aufteilung anhand von Trennzeichen und maximaler Zeichenlänge in Blöcke auf.

Snowflake

ChunkText

Teilt Text mit Optionen für die rekursive Aufteilung anhand von Trennzeichen und maximaler Zeichenlänge in Blöcke auf.

CompressContent

Komprimiert oder dekomprimiert den Inhalt von FlowFiles mit einem vom Benutzer angegebenen Komprimierungsalgorithmus und aktualisiert das Mime-Format.

ConnectWebSocket

Dient als WebSocket-Client-Endpunkt zur Interaktion mit einem Remote-WebSocket-Server.

ConsumeAMQP

Empfängt AMQP-Meldungen von einem AMQP-Broker unter Verwendung von AMQP 0.

ConsumeAzureEventHub

Empfängt Meldungen von Microsoft Azure Event Hubs mit Checkpoints, um eine konsistente Ereignisverarbeitung sicherzustellen.

ConsumeBoxEnterpriseEvents

Empfängt Enterprise-Ereignisse aus dem Stream-Typ „admin_logs_streaming“ von Box.

ConsumeBoxEvents

Verarbeitet alle Ereignisse von Box.

ConsumeElasticsearch

Ein Prozessor, der wiederholt eine paginierte Abfrage auf ein Feld unter Verwendung einer Bereichsabfrage (Range Query) durchführt, um neue Dokumente aus einem Elasticsearch-Index/einer Elasticsearch-Abfrage zu verarbeiten.

ConsumeGCPubSub

Verarbeitet Meldungen aus dem konfigurierten Google Cloud PubSub-Abonnement.

ConsumeIMAP

Verarbeitet Meldungen vom E-Mail-Server über das IMAP-Protokoll.

ConsumeJMS

Verarbeitet JMS-Meldungen des Typs BytesMessage, TextMessage, ObjectMessage, MapMessage oder StreamMessage, wandelt ihren Inhalt in ein FlowFile um und überführt es in die Beziehung „success“.

ConsumeKafka

Verarbeitet Meldungen von der Apache Kafka Consumer-API.

Snowflake

ConsumeKafka

Verarbeitet Meldungen von der Apache Kafka Consumer-API.

ConsumeKinesisStream

Liest Daten aus dem angegebenen AWS Kinesis-Stream und gibt ein FlowFile für jeden verarbeiteten Datensatz (roh) oder eine FlowFile für einen Batch verarbeiteter Datensätze aus, wenn ein Record Reader und Record Writer konfiguriert sind.

ConsumeMQTT

Abonniert ein Thema und empfängt Meldungen von einem MQTT-Broker

ConsumePOP3

Verarbeitet Meldungen vom E-Mail-Server über das POP3-Protokoll.

ConsumeSlack

Ruft Meldungen aus einem oder mehreren konfigurierten Slack-Kanälen ab.

Snowflake

ConsumeSlackConversation

Ruft Meldungen aus Slack-Konversationen ab, die für die App verfügbar sind.

Snowflake

ConsumeSlackHistory

Ruft historische Meldungen aus allen für die App verfügbaren Slack-Kanälen ab.

Snowflake

ConsumeSnowflakeStream

Ruft Daten aus einem Snowflake-Stream ab und schreibt sie in ein FlowFile.

ConsumeTwitter

Streamt Tweets von Twitters Streaming-API v2.

ControlRate

Steuert die Geschwindigkeit, mit der Daten an die Folgeprozessoren übertragen werden.

ConvertCharacterSet

Konvertiert den Inhalt eines FlowFile von einem Zeichensatz in einen anderen

ConvertRecord

Konvertiert Datensätze mithilfe der konfigurierten Controller Services Record Reader- und Record Writer von einem Datenformat in ein anderes.

Snowflake

ConvertToJournalSchema

Konvertiert das eingehende Datenbankschema in das entsprechende Schema für eine Snowflake CDC-Journaltabelle.

CopyAzureBlobStorage_v12

Kopiert einen Blob in Azure Blob Storage von einem Konto/Container in einen anderen.

CopyS3Object

Kopiert eine Datei von einem Bucket und Schlüssel in einen anderen in AWS S3

CountText

Zählt verschiedene Metriken für eingehenden Text.

Snowflake

CreateAmazonAdsReport

Prozessor, der die Berichtskonfiguration für den Amazon Ads Connector erstellt.

Snowflake

CreateAzureOpenAiEmbeddings

Verwendet Azure OpenAI, um Einbettungen für Text zu erstellen.

CreateBoxFileMetadataInstance

Erzeugt eine Metadateninstanz für eine Box-Datei unter Verwendung einer angegebenen Vorlage mit Werten aus dem FlowFile-Inhalt.

CreateBoxMetadataTemplate

Erzeugt eine Box-Metadatenvorlage unter Verwendung von Feldspezifikationen aus dem FlowFile-Inhalt.

Snowflake

CreateCohereEmbeddings

Verwendet Cohere, um Einbettungen für Text zu erstellen.

Snowflake

CreateMetaAdsReport

Prozessor, der die Berichtskonfiguration für den Meta Ads Connector erstellt.

Snowflake

CreateOpenAiEmbeddings

Verwendet OpenAI, um Einbettungen für Text zu erstellen.

Snowflake

CreateSnowflakeEmbeddings

Vektoreinbettungen mit den Funktionen des Snowflake Cortex Large Language Model erstellen

Snowflake

CreateVertexAIEmbeddings

Verwendet VertexAI, um Einbettungen für Text zu erstellen.

CryptographicHashContent

Berechnet einen kryptografischen Hashwert für den Inhalt des FlowFile unter Verwendung des angegebenen Algorithmus und schreibt ihn in ein Ausgabeattribut.

D

Prozessor

Beschreibung

DebugFlow

Der DebugFlow-Prozessor unterstützt Testen und Debuggen des FlowFile-Frameworks, indem er es ermöglicht, verschiedene Antworten explizit als Reaktion auf den Empfang eines FlowFile oder eines Timer-Ereignisses ohne FlowFile auszulösen, wenn Sie eine Timer- oder Cron-basierte Zeitplanung verwenden.

DecryptContentAge

Entschlüsselt Inhalte mit der Age-Verschlüsselung.

DecryptContentPGP

Entschlüsselt den Inhalt von OpenPGP-Meldungen.

DeduplicateRecord

Dieser Prozessor dedupliziert Datensätze innerhalb einer Datensatzgruppe.

DeleteAzureBlobStorage_v12

Löscht den angegebenen Blob aus Azure Blob Storage.

DeleteAzureDataLakeStorage

Löscht die bereitgestellte Datei aus Azure Data Lake Storage.

DeleteBoxFileMetadataInstance

Löscht eine Metadateninstanz aus einer Box-Datei unter Verwendung des angegebenen Vorlagenschlüssels

DeleteByQueryElasticsearch

Löscht aus einem Elasticsearch-Index mithilfe einer Abfrage.

Snowflake

DeleteDBFSResource

Löscht DBFS-Dateien und Verzeichnisse.

DeleteDynamoDB

Löscht ein Dokument aus DynamoDB basierend auf einem Hashwert und einem Bereichsschlüssel.

DeleteFile

Löscht eine Datei aus dem Dateisystem.

DeleteGCSObject

Löscht Objekte aus einem Google Cloud Bucket.

DeleteGridFS

Löscht eine Datei von GridFS anhand eines Dateinamens oder einer Abfrage.

Snowflake

DeleteMilvus

Löscht Vektoren anhand ihrer ID aus der Milvus-Datenbank aus einer Sammlung.

DeleteMongo

Führt eine Abfrage zum Löschen in einer MongoDB-Sammlung aus.

Snowflake

DeletePinecone

Löscht Vektoren aus einem Pinecone-Index.

Snowflake

DeleteQueryJob

Löscht einen Abfrageauftrag in Salesforce mit der Bulk-API 2.

DeleteS3Object

Löscht eine Datei aus einem Amazon S3-Bucket.

DeleteSFTP

Löscht eine Datei, die sich auf einem SFTP-Server befindet.

DeleteSQS

Löscht eine Meldung aus einer Amazon Simple Queuing Service-Warteschlange.

Snowflake

DeleteUnityCatalogResource

Löscht ein/e Unity Catalog-Datei oder -Verzeichnis.

Snowflake

DescribeDataShare

Beschreiben Sie die angegebenen Metadaten zur Datenfreigabe in Salesforce Data Cloud.

Snowflake

DescribeSFDCObject

Beschreibt die angegebenen Objektmetadaten in Salesforce.

DetectDuplicate

Speichert einen Wert, der aus FlowFile-Attributen berechnet wird, für jedes eingehende FlowFile und stellt fest, ob der gespeicherte Wert bereits gesehen wurde.

DistributeLoad

Verteilt FlowFiles auf der Grundlage einer Verteilungsstrategie an nachgelagerte Prozessoren.

DuplicateFlowFile

Dieser Prozessor ist für Lasttests vorgesehen und erstellt die konfigurierte Anzahl von Kopien jedes eingehenden FlowFile.

E

Prozessor

Beschreibung

EncodeContent

Codiert oder decodiert den Inhalt eines FlowFile mit Base64-, Base32- oder Hex-Codierungsschemas.

EncryptContentAge

Verschlüsselt Inhalte mit der Age-Verschlüsselung.

EncryptContentPGP

Verschlüsselt Inhalte mit OpenPGP.

EnforceOrder

Erzwingt die erwartete Reihenfolge von FlowFiles, die innerhalb eines einzelnen Knotens zur gleichen Datengruppe gehören.

Snowflake

EnrichAttributes

Sucht einen Wert mithilfe des konfigurierten Nachschlagedienstes und fügt die Ergebnisse als ein oder mehrere Attribute zum FlowFile hinzu.

Snowflake

EnrichCdcStream

Reichert die eingehenden FlowFilesan, die von CaptureChangePostgreSQL usw. kommen.

EvaluateJsonPath

Bewerten einen oder mehrere JsonPath-Ausdrücke anhand des Inhalts eines FlowFile.

Snowflake

EvaluateRagAnswerCorrectness

Bewertet die Korrektheit der generierten Antworten in einem Retrieval-Augmented-Generation (RAG)-Kontext durch die Berechnung von Metriken wie F1-Score, Kosinusähnlichkeit und Korrektheit der Antworten.

Snowflake

EvaluateRagFaithfulness

Bewertet die Genauigkeit der generierten Antworten in einem Retrieval-Augmented Generation (RAG)-System durch Analyse der Antworten mithilfe eines LLM (e.

Snowflake

EvaluateRagRetrieval

Berechnet Abrufmetriken (Precision@N, Recall@N, FScore@N, MAP@N, MRR) für einRAG-System unter Verwendung eines LLM als Bewertungsinstanz.

EvaluateXPath

Bewertet eine oder mehrere XPaths anhand des Inhalts eines FlowFile.

EvaluateXQuery

Bewertet eine oder mehrere XQueries anhand des Inhalts eines FlowFile.

ExecuteGroovyScript

Experimenteller erweiterter Groovy-Skriptprozessor.

ExecuteProcess

Führt einen vom Benutzer angegebenen Betriebssystembefehl aus und schreibt die Ausgabe dieses Befehls in ein FlowFile.

ExecuteScript

Experimentell – Führt ein Skript mit dem FlowFile und einer Prozesssitzung aus.

ExecuteSQL

Führt die bereitgestellte SQL-Select-Abfrage aus.

ExecuteSQLRecord

Führt die bereitgestellte SQL-Select-Abfrage aus.

Snowflake

ExecuteSQLStatement

Führt eine SQL DDL- oder DML-Anweisung gegen eine Datenbank aus.

ExecuteStreamCommand

Der ExecuteStreamCommand-Prozessor bietet eine flexible Möglichkeit, externe Befehle und Skripte in NiFi-Datenflüsse zu integrieren.

ExtractAvroMetadata

Extrahiert Metadaten aus dem Header einer Avro-Datendatei.

ExtractEmailAttachments

Extrahiert Anhänge aus einer E-Mail-Datei im Mime-Format und teilt sie in einzelne FlowFiles auf.

ExtractEmailHeaders

Extrahiert unter Verwendung des FlowFile-Inhalts als Datenquelle den Header aus einer RFC-konformen E-Mail-Datei und fügt die entsprechenden Attribute zum FlowFile hinzu.

ExtractGrok

Wertet einen oder mehrere Grok-Ausdrücke gegen den Inhalt eines FlowFile aus, fügt die Ergebnisse als Attribute hinzu oder ersetzt den Inhalt des FlowFile durch eine JSON-Notation des übereinstimmenden Inhalts.

ExtractRecordSchema

Extrahiert das Datensatzschema aus FlowFile mithilfe des mitgelieferten Record Reader und schreibt es in die „avro.

Snowflake

ExtractSchemaColumns

Extrahiert die Spalten des Datensatzschemas aus dem FlowFile mithilfe des mitgelieferten Record Reader und schreibt sie in das Schema.

ExtractStructuredBoxFileMetadata

Extrahiert Metadaten aus einer Box-Datei mit Box AI.

ExtractText

Wertet einen oder mehrere reguläre Ausdrücke gegen den Inhalt eines FlowFile aus.

F

Prozessor

Beschreibung

FetchAzureBlobStorage_v12

Ruft den angegebenen Blob aus Azure Blob Storage ab und schreibt seinen Inhalt in den Inhalt des FlowFile.

FetchAzureDataLakeStorage

Ruft die angegebene Datei aus Azure Data Lake Storage ab.

FetchBoxFile

Ruft Dateien aus einem Box-Ordner ab.

FetchBoxFileInfo

Holt Metadaten für Dateien aus Box und fügt sie den Attributen des FlowFile hinzu.

FetchBoxFileMetadataInstance

Ruft bestimmte Metadateninstanzen ab, die mit einer Box-Datei verknüpft sind, unter Verwendung eines Vorlagenschlüssels und eines Bereichs.

FetchBoxFileRepresentation

Holt eine Box-Dateidarstellung unter Verwendung eines Darstellungshinweises und schreibt sie in den Inhalt des FlowFile.

FetchDistributedMapCache

Berechnet den/die Cache-Schlüssel aus FlowFile-Attributen für jedes eingehende FlowFile und ruft den/die Wert(e) aus dem verteilten Map-Cache ab, der mit jedem Schlüssel verbunden ist.

FetchDropbox

Ruft Dateien aus Dropbox ab.

FetchFile

Liest den Inhalt einer Datei von der Festplatte und streamt ihn in den Inhalt eines eingehenden FlowFile.

FetchFTP

Ruft den Inhalt einer Datei von einem Remote-FTP-Server ab und überschreibt den Inhalt eines eingehenden FlowFile mit dem Inhalt der Remote-Datei.

FetchGCSObject

Ruft eine Datei aus einem Google Cloud Bucket ab.

FetchGoogleDrive

Ruft Dateien aus einem Google Drive-Ordner ab.

Snowflake

FetchGoogleDriveFileComments

Ruft Kommentare und ihre Antworten für eine Google Drive-Datei ab.

Snowflake

FetchGoogleDriveMetadata

Ruft die Metadaten von Google Drive-Dateien ab.

FetchGridFS

Ruft eine oder mehrere Dateien aus einem GridFS-Bucket nach Dateinamen oder durch eine benutzerdefinierte Abfrage ab.

Snowflake

FetchJiraIssues

Ruft Vorgänge aus Jira Cloud unter Verwendung der REST-API v3 mit konfigurierbaren Suchoptionen ab.

Snowflake

FetchMicrosoftDataverseTable

Ruft Datensätze aus Microsoft Dataverse-Tabellen ab

FetchS3Object

Ruft den Inhalt eines S3-Objekts ab und schreibt ihn in den Inhalt eines FlowFile

FetchSFTP

Ruft den Inhalt einer Datei von einem Remote-SFTP-Server ab und überschreibt den Inhalt eines eingehenden FlowFile mit dem Inhalt der Remote-Datei.

Snowflake

FetchSharepointFile

Ruft den Inhalt einer Datei von einem SharePoint-Laufwerk ab und lädt optional eine PDF- oder HTML-Version der Datei herunter, falls zutreffend.

Snowflake

FetchSharepointMetadata

Für jedes Laufwerkselement werden die Metadaten und Berechtigungen abgerufen und als FlowFile-Attribute geschrieben.

Snowflake

FetchSlackConversationInfo

Ruft Informationen zu Slack-Konversationen und E-Mails von Mitgliedern ab.

Snowflake

FetchSlackFile

Lädt eine auf Slack freigegebene Datei herunter.

Snowflake

FetchSlackMessage

Ruft Daten über eine einzelne Slack-Meldung ab.

FetchSmb

Ruft Dateien von einer SMB-Freigabe ab.

Snowflake

FetchSnowflakeTableProperties

Liest Eigenschaften aus einer Tabelle und speichert sie als Attribute eines FlowFile.

Snowflake

FetchSourceTableSchema

Holt das Tabellenschema (i.

Snowflake

FetchTableSnapshot

Holt einen Snapshot einer Tabelle aus einer Datenbank.

FilterAttribute

Filtert die Attribute eines FlowFile, indem bestimmte Attribute beibehalten werden und der Rest entfernt wird oder indem bestimmte Attribute entfernt werden und der Rest beibehalten wird.

Snowflake

FindSharepointDriveItem

Findet ein SharePoint Drive-Objekt anhand seiner Laufwerks-ID und seines Elementpfads.

FlattenJson

Bietet dem Benutzer die Möglichkeit, ein verschachteltes JSON-Dokument in ein einfaches Schlüssel-Wertpaar-Dokument umzuwandeln.

ForkEnrichment

In Verbindung mit dem JoinEnrichment-Prozessor ist dieser Prozessor für das Hinzufügen der Attribute zuständig, die der JoinEnrichment -Prozessor benötigt, um seine Funktion zu erfüllen.

ForkRecord

Dieser Prozessor ermöglicht es dem Benutzer, einen Datensatz in mehrere Datensätze aufzuteilen.

G

Prozessor

Beschreibung

Snowflake

GenerateAnswersFromContext

Generiert synthetische Antworten für jede Frage in den eingehenden Datensätzen unter Verwendung eines Large Language Model (LLM).

Snowflake

GenerateAnswersFromGroundTruth

Erzeugt synthetische Antworten für jede Frage in den eingehenden Datensätzen unter Verwendung eines LLM.

GenerateFlowFile

Dieser Prozessor erstellt FlowFiles mit zufälligen Daten oder benutzerdefinierten Inhalten.

Snowflake

GenerateJSON

Erzeugt einen Batch von JSON-Objekten mit zufälligen Feldwerten auf der Grundlage eines konfigurierbaren JSON-Schemas.

GenerateRecord

Dieser Prozessor erstellt FlowFiles mit Datensätzen, die Zufallswerte für die angegebenen Felder enthalten.

GenerateTableFetch

Erzeugt SQL-Select-Abfragen, die „Seiten“ von Zeilen aus einer Tabelle abrufen.

GeoEnrichIP

Sucht Geolokalisierungsinformationen für eine IP-Adresse und fügt die Geoinformationen zu den FlowFile-Attributen hinzu.

GeoEnrichIPRecord

Sucht Geolokalisierungsinformationen für eine IP-Adresse und fügt die Geoinformationen zu den FlowFile-Attributen hinzu.

Snowflake

GetAmazonAdsReport

Der Prozessor lädt den Bericht von Amazon Ads herunter, wenn er bereit ist.

GetAwsPollyJobStatus

Ruft den aktuellen Status eines AWS Polly-Jobs ab.

GetAwsTextractJobStatus

Ruft den aktuellen Status eines AWS Textract-Auftrags ab.

GetAwsTranscribeJobStatus

Ruft den aktuellen Status eines AWS Transcribe-Jobs ab.

GetAwsTranslateJobStatus

Ruft den aktuellen Status eines AWS Translate-Jobs ab.

GetAzureEventHub

Empfängt Meldungen von Microsoft Azure Event Hubs ohne zuverlässige Checkpoint-Verfolgung.

GetAzureQueueStorage_v12

Ruft die Meldungen aus einem Azure-Warteschlangenspeicher ab.

GetBoxFileCollaborators

Ruft alle Teilnehmer in einer Box-Datei ab und fügt die Informationen zur Zusammenarbeit zu den Attributen der FlowFile hinzu.

GetBoxGroupMembers

Ruft Mitglieder für eine Box-Gruppe ab und schreibt ihre Details in FlowFile-Attribute.

Snowflake

GetDataShareCredentials

Beschreiben Sie die angegebenen Metadaten zur Datenfreigabe in Salesforce Data Cloud.

Snowflake

GetDataShareTables

Beschreiben Sie die angegebenen Metadaten zur Datenfreigabe in Salesforce Data Cloud.

Snowflake

GetDBFSFile

Liest eine DBFS-Datei.

GetDynamoDB

Ruft ein Dokument von DynamoDB ab, basierend auf einem Hashwert und einem Bereichsschlüssel.

GetElasticsearch

Elasticsearch-Get-Prozessor, der die offiziellen Elastic REST-Client-Bibliotheken verwendet, um ein einzelnes Dokument anhand seiner _id aus Elasticsearch abzurufen.

GetFile

Erzeugt FlowFiles aus den Dateien in einem Verzeichnis.

GetFileResource

Dieser Prozessor erstellt FlowFiles mit dem Inhalt der konfigurierten Dateiressource.

GetFTP

Ruft Dateien von einem FTP-Server ab und erstellt daraus FlowFiles

GetGcpVisionAnnotateFilesOperationStatus

Ruft den aktuellen Status einer Google Vision-Operation ab.

GetGcpVisionAnnotateImagesOperationStatus

Ruft den aktuellen Status einer Google Vision-Operation ab.

Snowflake

GetGoogleAdsReport

Ein Prozessor, der mit der Google Ads Reporting-API interagieren kann.

Snowflake

GetGoogleGroupMembers

Ruft die Mitglieder einer oder mehrerer Google-Gruppen ab, die als durch Kommas getrennte Liste der Gruppen-IDs angegeben sind, die als FlowFile-Attribut angegeben wird.

Snowflake

GetGoogleSheets

Prozessor, der für das Abrufen von Daten aus Google Sheets zuständig ist.

GetHubSpot

Ruft JSON-Daten aus einer privaten HubSpot-Anwendung ab.

Snowflake

GetHubSpotObject

Ruft ein HubSpot-Objekt und seine Verknüpfungen über die ID oder einen eindeutigen Wert ab.

Snowflake

GetLinkedInAdsReport

Prozessoren, die Metriken von LinkedIn Reporting-APIs herunterladen.

Snowflake

GetMicrosoft365GroupMembers

Ruft Microsoft365-Gruppenmitglieder ab und sendet bei jeder Änderung ein FlowFile.

GetMongo

Erstellt FlowFiles aus Dokumenten in MongoDB, die durch eine vom Benutzer angegebene Abfrage geladen wurden.

GetMongoRecord

Eine datensatzbasierte Version von GetMongo, die von den Record Writers verwendet wird, um das Resultset MongoDB zu schreiben.

Snowflake

GetQueryJobResult

Ruft die Ergebnisse eines Abfragejobs in Salesforce über die Bulk-API ab. 2.

Snowflake

GetQueryJobStatus

Ruft den Status eines Abfragejobs in Salesforce über die Funktion Bulk-API 2 ab.

GetS3ObjectMetadata

Prüft, ob ein Objekt in S3 vorhanden ist, und ruft seine Metadaten ab, ohne zu versuchen, es herunterzuladen.

GetS3ObjectTags

Überprüft, ob ein Objekt in S3 vorhanden ist, und ruft dessen Tags ab, ohne zu versuchen, es herunterzuladen.

GetSFTP

Ruft Dateien von einem SFTP-Server ab und erstellt daraus FlowFiles

Snowflake

GetSharepointSiteGroupMembers

Ruft alle Mitglieder einer SharePoint-Website-Gruppe ab.

GetShopify

Ruft Objekte aus einem benutzerdefinierten Shopify-Shop ab.

GetSmbFile

Liest eine Datei von einem Samba-Netzwerkspeicherort in FlowFiles.

GetSplunk

Ruft Daten von Splunk Enterprise ab.

GetSQS

Ruft Meldungen aus einer Amazon Simple Queuing Service-Warteschlange ab

Snowflake

GetUnityCatalogFile

Liest eine Unity Catalog-Datei mit bis zu 5 GiB.

Snowflake

GetUnityCatalogFileMetadata

Prüft, ob die Metadaten der Unity Catalog-Datei vorhanden sind.

GetWorkdayReport

Ein Prozessor, der mit einem konfigurierbaren Workday-Bericht interagieren kann.

GetZendesk

Ruft inkrementell Daten aus der Zendesk-API ab.

H

Prozessor

Beschreibung

HandleHttpRequest

Startet einen HTTP-Server und überwacht auf HTTP-Anfragen.

HandleHttpResponse

Sendet eine HTTP-Antwort an den Absender, der ein FlowFile generiert hat.

I

Prozessor

Beschreibung

IdentifyMimeType

Versucht, den MIME-Typ zu identifizieren, der für ein FlowFile verwendet wird.

InvokeHTTP

Ein HTTP-Client-Prozessor, der mit einem konfigurierbaren HTTP-Endpunkt interagieren kann.

InvokeScriptedProcessor

Experimentell – Ruft eine Skript-Engine für einen im angegebenen Skript definierten Prozessor auf.

ISPEnrichIP

Sucht nach ISP-Informationen für eine IP-Adresse und fügt die Informationen zu FlowFile-Attributen hinzu.

J

Prozessor

Beschreibung

JoinEnrichment

Fügt Datensätze aus zwei verschiedenen FlowFiles zusammen, wobei ein FlowFile, das „Original“, beliebige Datensätze enthält und das zweite FlowFile, die „Anreicherung“, zusätzliche Daten enthält, die zur Anreicherung des ersten verwendet werden sollen.

JoltTransformJSON

Wendet eine Liste von Jolt-Spezifikationen entweder auf den Inhalt von FlowFile JSON oder auf ein bestimmtes FlowFile JSON -Attribut an.

JoltTransformRecord

Wendet eine JOLT-Spezifikation auf jeden Datensatz in der FlowFile-Nutzlast an.

JSLTTransformJSON

Wendet eine JSLT-Transformation auf die FlowFile JSON-Nutzlast an.

JsonQueryElasticsearch

Ein Prozessor, mit dem der Benutzer eine Abfrage (mit Aggregationen) ausführen kann, die mit Elasticsearch JSON DSL geschrieben wurde.

L

Prozessor

Beschreibung

Snowflake

ListArchivedHubSpotData

Listet die archivierten Daten aus dem HubSpot für den gewählten Objekttyp auf und erzeugt ein FlowFile pro aufgelistetem Objekt mit den entsprechenden Metadaten als FlowFile-Attribut.

ListAzureBlobStorage_v12

Listet Blobs in einem Azure Blob Storage-Container auf.

ListAzureDataLakeStorage

Listet das Verzeichnis in einem Azure Data Lake Storage Gen 2-Dateisystem auf

ListBoxFile

Listet die Dateien in einem Box-Ordner auf.

ListBoxFileInfo

Holt die Datei-Metadaten für jede Datei in einem Box-Ordner.

ListBoxFileMetadataInstances

Ruft alle Metadateninstanzen ab, die mit einer Box-Datei verbunden sind.

ListBoxFileMetadataTemplates

Ruft alle Metadatenvorlagen ab, die mit einer Box-Datei verbunden sind.

ListDatabaseTables

Erzeugt eine Reihe von FlowFiles, die jeweils Attribute enthalten, die den Metadaten einer Tabelle aus einer Datenbankverbindung entsprechen.

Snowflake

ListDBFSDirectory

Listet die Dateinamen in einem DBFS-Verzeichnis auf und gibt ein neues FlowFile mit dem Dateinamen aus.

ListDropbox

Ruft eine Liste von Dateien aus Dropbox ab (Verknüpfungen werden ignoriert).

ListenFTP

Startet einen FTP-Server, der auf dem angegebenen Port lauscht und eingehende Dateien in FlowFiles umwandelt.

ListenHTTP

Startet einen HTTP-Server und lauscht auf einem bestimmten Basispfad, um eingehende Anfragen in FlowFiles umzuwandeln.

ListenOTLP

Sammelt OpenTelemetry-Meldungen über HTTP oder gRPC.

ListenSlack

Ruft Echtzeit-Meldungen oder Slack-Befehle aus einer oder mehreren Slack-Konversationen ab.

ListenSyslog

Hört auf Syslog-Meldungen, die über TCP oder UDP an einen bestimmten Port gesendet werden.

ListenTCP

Lauscht auf eingehende TCP-Verbindungen und liest Daten von jeder Verbindung, wobei ein Zeilentrenner als Meldungstrennzeichen verwendet wird.

ListenUDP

Überwacht einen bestimmten Port auf Datagramm-Pakete.

ListenUDPRecord

Lauscht auf einem bestimmten Port auf Datagramm-Pakete und liest den Inhalt jedes Datagramms mit dem konfigurierten Record Reader.

ListenWebSocket

Fungiert als Endpunkt des WebSocket-Servers, um Client-Verbindungen zu akzeptieren.

ListFile

Ruft eine Liste der Dateien aus dem Eingabeverzeichnis ab.

ListFTP

Listet die Dateien auf, die sich auf einem FTP-Server befinden.

ListGCSBucket

Ruft eine Liste von Objekten aus einem GCS-Bucket ab.

ListGoogleDrive

Listet konkrete Dateien (Verknüpfungen werden ignoriert) in einem Google Drive-Ordner auf.

Snowflake

ListGoogleDriveFileInfo

Listet alle Dateien und Ordner in einem bestimmten Google Drive auf.

Snowflake

ListGoogleGroups

Listet alle Gruppen für eine bestimmte Domäne in Google Workspace auf.

Snowflake

ListHubSpotObjects

Ruft Daten aus HubSpot für bestimmte Objekttypen ab und generiert pro aufgelistetem Objekt ein FlowFile mit den entsprechenden Metadaten als FlowFile-Attribute.

Snowflake

ListMicrosoftDataverseTables

Listet Tabellen aus Microsoft Dataverse-Umgebungen auf.

ListS3

Ruft eine Liste von Objekten aus einem S3-Bucket ab.

Snowflake

ListSFDCDataShares

Listet die verfügbaren Datenfreigaben in der Organisation auf, auf die der identifizierte Benutzer zugreifen kann.

Snowflake

ListSFDCObjects

Liste der verfügbaren Objekte in der Organisation, die dem identifizierten Benutzer zur Verfügung stehen.

ListSFTP

Listet die Dateien auf, die sich auf einem SFTP-Server befinden.

Snowflake

ListSharepointDrives

Sendet ein FlowFile für jedes Laufwerk, das in der angegebenen SharePoint-Website vorhanden ist.

Snowflake

ListSharepointSiteGroups

Listet alle SharePoint Standortgruppen auf, die auf einem bestimmten SharePoint-Standort verfügbar sind.

ListSmb

Listet konkrete Dateien auf, die über das SMB-Protokoll freigegeben wurden.

Snowflake

ListTableNames

Holt alle Quelltabellennamen und gleicht sie mit einer der möglichen Konfigurationen ab:- regexp expression e.

Snowflake

ListUnityCatalogDirectory

Listet die Dateinamen in einem Unity Catalog-Verzeichnis auf und gibt ein neues FlowFile mit dem Dateinamen aus.

LogAttribute

Gibt die Attribute des FlowFile gemäß dem angegebenen Protokolliergrad aus.

LogMessage

Gibt eine Protokollmeldung gemäß dem angegebenen Protokolliergrad aus.

LookupAttribute

Lookup von Attributen aus einem Lookup-Service

LookupRecord

Extrahiert ein Feld oder mehrere Felder aus einem Datensatz und sucht in einem LookupService nach einem Wert für diese Felder.

M

Prozessor

Beschreibung

MergeContent

Führt eine Gruppe von FlowFiles auf der Grundlage einer benutzerdefinierten Strategie zusammen und verpackt sie in einem einzigen FlowFile.

MergeRecord

Dieser Prozessor fügt mehrere datensatzorientierte FlowFiles zu einem einzigen FlowFile zusammen, der alle Datensätze der Eingabe-FlowFiles enthält.

Snowflake

MergeSnowflakeJournalTable

Löst eine Operation zur Zusammenführung für Änderungen von der Journaltabelle zu einer Zieltabelle in Snowflake aus.

ModifyBytes

Bytebereich am Anfang und Ende oder den gesamten Inhalt einer Binärdatei verwerfen.

ModifyCompression

Ändert den Komprimierungsalgorithmus, mit dem der Inhalt eines FlowFile komprimiert wird, indem er den Inhalt von FlowFiles mit einem vom Benutzer angegebenen Komprimierungsalgorithmus dekomprimiert und den Inhalt mit den angegebenen Komprimierungsformateigenschaften neu komprimiert.

MonitorActivity

Überwacht den Datenfluss auf Aktivität und sendet eine Meldung, wenn der Datenfluss für einen bestimmten Zeitraum keine Daten empfangen hat, sowie erneut, wenn die Aktivität des Datenflusses wiederhergestellt ist.

MoveAzureDataLakeStorage

Verschiebt Inhalte innerhalb eines Azure Data Lake Storage Gen 2.

N

Prozessor

Beschreibung

Benachrichtigen

Speichert einen Freigabesignalbezeichner im verteilten Cache, optional zusammen mit den Attributen von FlowFile.

O

Prozessor

Beschreibung

Snowflake

OpenAiTranscribeAudio

Transkribiert Audio in englischen Text.

P

Prozessor

Beschreibung

PackageFlowFile

Dieser Prozessor verpackt die Attribute und Inhalte des FlowFile in ein Ausgabe-FlowFile, das aus NiFi exportiert und wieder in NiFi importiert werden kann, wobei die ursprünglichen Attribute und Inhalte erhalten bleiben.

PaginatedJsonQueryElasticsearch

Ein Prozessor, mit dem der Benutzer eine paginierte Abfrage (mit Aggregationen) ausführen kann, die mit Elasticsearch JSON DSL geschrieben wurde.

ParseEvtx

Analysiert den Inhalt einer Windows-Ereignisprotokolldatei (evtx) und schreibt die resultierende XML-Datei in dasFlowFile

Snowflake

ParseExcelCellReference

Prozessor, der für das Parsen von Excel-Zellreferenzformeln zuständig ist.

ParseSyslog

Versucht, den Inhalt einer Syslog-Meldung in Übereinstimmung mit den Formaten RFC5424 und RFC3164 zu parsen und fügt dem FlowFile Attribute für jeden Teil der Syslog-Meldung hinzu.

ParseSyslog5424

Versucht, den Inhalt einer gut geformten Syslog-Meldung gemäß dem RFC5424-Format zu analysieren und fügt dem FlowFile für jeden Teil der Syslog-Meldung, Attribute hinzu, einschließlich der strukturierten Daten.

PartitionRecord

Teilt oder partitioniert datensatzorientierte Daten basierend auf den konfigurierten Feldern in den Daten.

Snowflake

PerformSnowflakeCortexOCR

Führt eine optische Zeichenerkennung (OCR) auf PDF-Dokumenten durch und verwendet dabei die Funktionen von Snowflake Cortex ML.

Snowflake

PickTablesForReplication

Akzeptiert eine Liste vollqualifizierter Tabellennamen und ermittelt, ob eine Tabelle: - neu ist (nicht repliziert, aber in der Quelle hinzugefügt wurde) - existiert (repliziert und in der Quelle vorhanden) - veraltet ist (repliziert, aber in der Quelle nicht mehr vorhanden). Die Konfiguration wird als FlowFile-Attribut übergeben.

Snowflake

PromptAnthropicAI

Sendet eine Eingabeaufforderung an Anthropic und schreibt die Antwort entweder als FlowFile-Attribut oder in den Inhalt des eingehenden FlowFile.

Snowflake

PromptAzureOpenAI

Sendet eine Eingabeaufforderung an den OpenAI-Dienst von Azure und schreibt die Antwort entweder als FlowFile-Attribut oder in den Inhalt des eingehenden FlowFile.

Snowflake

PromptLLM

Dieser Prozessor sendet eine benutzerdefinierte Eingabeaufforderung an ein Large Language Model (LLM), das darauf antwortet.

Snowflake

PromptOpenAI

Sendet eine Eingabeaufforderung an OpenAI und schreibt die Antwort entweder als FlowFile-Attribut oder in den Inhalt des eingehenden FlowFile.

Snowflake

PromptSnowflakeCortex

Sendet eine Eingabeaufforderung an Snowflake Cortex und schreibt die Antwort entweder als FlowFile-Attribut oder in den Inhalt des eingehenden FlowFile.

Snowflake

PromptVertexAI

Sendet eine Eingabeaufforderung an VertexAI und schreibt die Antwort entweder als FlowFile-Attribut oder in den Inhalt des eingehenden FlowFile.

PublishAMQP

Erzeugt eine AMQP-Meldung aus dem Inhalt eines FlowFile und sendet die Meldung an eine AMQP-Börse.

PublishGCPubSub

Veröffentlichen Sie den Inhalt des eingehenden FlowFile im konfigurierten Google Cloud PubSub-Thema.

PublishJMS

Erzeugt eine JMS-Meldung aus dem Inhalt eines FlowFile und sendet sie als JMS BytesMessage oder TextMessage an ein JMS-Ziel (Warteschlange oder Thema).

PublishKafka

Sendet den Inhalt eines FlowFile entweder als Meldung oder als einzelne Datensätze an Apache Kafka unter Verwendung der Kafka Producer-API.

Snowflake

PublishKafka

Sendet den Inhalt eines FlowFile entweder als Meldung oder als einzelne Datensätze an Apache Kafka unter Verwendung der Kafka Producer-API.

PublishMQTT

Veröffentlict eine Meldung in einem MQTT-Thema.

PublishSlack

Versendet eine Meldung an den angegebenen Slack-Kanal.

PutAzureBlobStorage_v12

Legt Inhalte in einem Blob auf Azure Blob Storage ab.

PutAzureCosmosDBRecord

Dieser Prozessor ist ein datensatzbasierter Prozessor zum Einfügen von Daten in eine Cosmos-DB mit der Core SQL-API.

PutAzureDataExplorer

Fungiert als Azure Data Explorer-Senke, der FlowFiles an den angegebenen Endpunkt sendet.

PutAzureDataLakeStorage

Schreibt den Inhalt eines FlowFile als Datei auf Azure Data Lake Storage Gen 2

PutAzureEventHub

FlowFile Inhalte an Azure Event Hubs senden

PutAzureQueueStorage_v12

Schreibt den Inhalt der eingehenden FlowFiles in den konfigurierten Azure Queue Storage.

PutBigQuery

Schreibt den Inhalt eines FlowFile in eine Google BigQuery-Tabelle.

PutBoxFile

Legt den Inhalt in einem Box-Ordner ab.

PutCloudWatchMetric

Veröffenlicht Metriken in Amazon CloudWatch.

PutDatabaseRecord

Der PutDatabaseRecord-Prozesser verwendet einen angegebenen RecordReader, um (möglicherweise mehrere) Datensätze aus einem eingehenden FlowFile einzugeben.

Snowflake

PutDatabricksSQL

Sendet eine SQL-Ausführung mit der Databricks REST-API, und schreiben Sie die JSON-Antwort in den FlowFile-Inhalt.

Snowflake

PutDBFSFile

Schreibt FlowFile-Inhalt in DBFS.

PutDistributedMapCache

Ruft den Inhalt eines FlowFile ab und speichert ihn in einem verteilten Map-Cache unter Verwendung eines Cache-Schlüssels, der aus den Attributen des FlowFile berechnet wird.

PutDropbox

Legt den Inhalt in einem Dropbox-Ordner ab.

PutDynamoDB

Legt ein Dokument aus DynamoDB basierend auf einem Hashwert und einem Bereichsschlüssel an.

PutDynamoDBRecord

Fügt Elemente auf der Grundlage von datensatzorientierten Daten in DynamoDB ein.

PutElasticsearchJson

Ein Elasticsearch-Put-Prozessor, der die offiziellen Elastic REST-Clientbibliotheken verwendet.

PutElasticsearchRecord

Ein datensatzbasierter Elasticsearch-Put-Prozessor, der die offiziellen Elastic REST-Client-Bibliotheken verwendet.

PutEmail

Sendet eine E-Mail an die konfigurierten Empfänger für jedes eingehende FlowFile.

PutFile

Schreibt den Inhalt eines FlowFile in das lokale Dateisystem.

PutFTP

Sendet FlowFiles an einen FTP-Server

PutGCSObject

Schreibt den Inhalt eines FlowFile als Objekt in einen Google Cloud Storage.

PutGoogleDrive

Schreibt den Inhalt eines FlowFile als Datei in Google Drive.

PutGridFS

Schreibt eine Datei in einen GridFS-Bucket.

Snowflake

PutHubSpot

Ein HubSpot Objekt upserten.

Snowflake

PutIcebergTable

Speichert Datensätze in Iceberg mit einem konfigurierbaren Katalog zur Verwaltung von Namespaces und Tabellen.

PutKinesisFirehose

Sendet den Inhalt an einen angegebenen Amazon Kinesis Firehose.

PutKinesisStream

Sendet den Inhalt an ein angegebenes Amazon Kinesis.

PutLambda

Sendet den Inhalt an eine angegebene Amazon Lambda-Funktion.

PutMongo

Schreibt den Inhalt eines FlowFile in MongoDB

PutMongoBulkOperations

Schreibt den Inhalt eines FlowFile nach MongoDB als Bulk-Update

PutMongoRecord

Dieser Prozessor ist ein datensatzbasiert Prozessor zum Einfügen/Upload von Daten in MongoDB.

PutRecord

Der PutRecord-Prozessor verwendet einen angegebene RecordReader, um (möglicherweise mehrere) Datensätze aus einem eingehenden FlowFile einzugeben, und sendet es an ein Ziel, das durch einen Record Destination Service (z. B.

PutRedisHashRecord

Speichert Datensatzfelddaten unter Verwendung eines angegebenen Hashwerts in Redis, der durch einen RecordPath zu einem Feld in jedem Datensatz bestimmt wird, das den Hashwert enthält.

PutS3Object

Schreibt den Inhalt eines FlowFile als S3-Objekt in einen Amazon S3 Bucket.

PutSalesforceObject

Erzeugt neue Datensätze für das angegebene Salesforce-sObject.

PutSFTP

Sendet FlowFiles an einen SFTP-Server

PutSmbFile

Schreibt den Inhalt eines FlowFile in ein Samba-Netzwerkverzeichnis.

Snowflake

PutSnowflakeInternalStageFile

Legt Dateien in einem internen Stagingbereich von Snowflake ab.

Snowflake

PutSnowpipeStreaming

Streamt Datensätze in eine Snowflake-Tabelle.

PutSNS

Sendet den Inhalt eines FlowFile als Benachrichtigung an den Amazon Simple Notification Service

PutSplunk

Sendet Protokolle an Splunk Enterprise über TCP, TCP + TLS/SSL, oder UDP.

PutSplunkHTTP

Sendet den Inhalt des FlowFile über HTTP oder HTTPS an den angegebenen Splunk-Server.

PutSQL

Führt einen SQL UPDATE- oder INSERT-Befehl aus.

PutSQS

Veröffentlichen einer Meldung in einer Amazon Simple Queuing Service-Warteschlange

PutSyslog

Sendet Syslog-Meldungen über TCP oder UDP an einen bestimmten Host und Port.

PutTCP

Sendet serialisierte FlowFiles oder Datensätze über TCP an ein konfigurierbares Ziel mit optionaler Unterstützung für TLS

PutUDP

Der PutUDP-Prozessor empfängt ein FlowFile und verpackt den FlowFile-Inhalt in ein einzelnes UDP-Datagramm-Paket, das dann an den konfigurierten UDP-Server übertragen wird.

Snowflake

PutUnityCatalogFile

Schreibt FlowFile-Inhalte mit einer maximalen Größe von 5 GiB in Unity Catalog.

Snowflake

PutVectaraDocument

Generiert ein JSON-Dokument und laden Sie es auf den Upload-Endpunkt von Vectara hoch.

Snowflake

PutVectaraFile

Lädt einen FlowFile-Inhalt auf den Indexendpunkt von Vectara hoch.

PutWebSocket

Sendet Meldungen an einen WebSocket-Remote-Endpunkt unter Verwendung einer WebSocket-Sitzung, die entweder von ListenWebSocket oder ConnectWebSocket aufgebaut wird.

PutZendeskTicket

Erstellt Zendesk-Tickets mit der Zendesk-API.

Q

Prozessor

Beschreibung

QueryAzureDataExplorer

Fragt von Azure Data Explorer und Streaming von JSON-Ergebnissen zu den Ausgabe-FlowFiles ab.

QueryDatabaseTable

Erzeugt eine SQL-Select-Abfrage oder verwendet eine bereitgestellte Anweisung und führt sie aus, um alle Zeilen abzurufen, deren Werte in der/den angegebenen Maximalwert-Spalte(n) größer sind als die zuvor angezeigten Maximalwerte.

QueryDatabaseTableRecord

Erzeugt eine SQL-Select-Abfrage oder verwendet eine bereitgestellte Anweisung und führt sie aus, um alle Zeilen abzurufen, deren Werte in der/den angegebenen Maximalwert-Spalte(n) größer sind als die zuvor angezeigten Maximalwerte.

Snowflake

QueryMilvus

Fragt eine bestimmte Sammlung in einer Milvus-Datenbank mithilfe von Vektoren ab.

Snowflake

QueryPinecone

Fragt Pinecone nach Vektoren ab, die dem Eingabevektor ähnlich sind, oder ruft einen Vektor über ID ab.

QueryRecord

Wertet eine oder mehrere SQL-Abfragen anhand des Inhalts eines FlowFile aus.

QuerySalesforceObject

Ruft Datensätze aus einem Salesforce sObject ab.

QuerySplunkIndexingStatus

Fragt den Splunk-Server ab, um den Status der Indizierungsbestätigung abzurufen.

R

Prozessor

Beschreibung

RemoveRecordField

Ändert den Inhalt eines FlowFile, das aufzeichnungsorientierte Daten enthält (z.

RenameRecordField

Benennt ein oder mehrere Felder in jedem Datensatz eines FlowFile um.

ReplaceText

Aktualisiert den Inhalt eines FlowFile, indem nach einem Textwert im FlowFile-Inhalt gesucht wird (über reguläre Ausdrücke/Regex oder einen literalen Wert) und der Abschnitt des Inhalts, der übereinstimmt, durch einen alternativen Wert ersetzt wird.

ReplaceTextWithMapping

Aktualisiert den Inhalt eines FlowFile, indem ein regulärer Ausdruck darauf angewendet wird und der Teil des Inhalts, der dem regulären Ausdruck entspricht, durch einen alternativen Wert ersetzt wird, der in einer Zuordnungsdatei angegeben ist.

RetryFlowFile

FlowFiles, die an diesen Prozessor übergeben werden, haben einen „Retry Attribute“-Wert, der mit einem konfigurierten „Maximum Retries“-Wert verglichen wird.

RouteOnAttribute

Weiterleitung von FlowFiles auf der Grundlage von Attributen unter Verwendung der Attribute Expression Language

RouteOnContent

Wendet reguläre Ausdrücke auf den Inhalt eines FlowFile an und leitet eine Kopie des FlowFile an jedes Ziel weiter, dessen regulärer Ausdruck passt.

RouteText

Routing von Textdaten auf der Grundlage einer Reihe von benutzerdefinierten Regeln.

Snowflake

RunDatabricksJob

Löst einen vordefinierten Databricks-Job mit benutzerdefinierten Parametern aus.

RunMongoAggregation

Ein Prozessor, der bei jedem Empfang eines FlowFile eine Aggregationsabfrage durchführt.

S

Prozessor

Beschreibung

SampleRecord

Nimmt eine Stichprobe der Datensätze eines FlowFile anhand einer festgelegten Stichprobenstrategie (z. B. Reservoir Sampling).

ScanAttribute

Scannt die angegebenen Attribute von FlowFiles und überprüft, ob einer ihrer Werte im angegebenen Begriffswörterbuch vorhanden ist.

ScanContent

Durchsucht den Inhalt von FlowFiles nach Begriffen, die in einem vom Benutzer bereitgestellten Wörterbuch enthalten sind.

ScriptedFilterRecord

Dieser Prozessor bietet die Möglichkeit, Datensätze aus FlowFiles herauszufiltern, indem er das vom Benutzer bereitgestellte Skript verwendet.

ScriptedPartitionRecord

Empfängt datensatzorientierte Daten (i.

ScriptedTransformRecord

Bietet die Möglichkeit, ein einfaches Skript für jeden Datensatz in einem eingehenden FlowFile zu bewerten.

ScriptedValidateRecord

Dieser Prozessor bietet die Möglichkeit, Datensätze in FlowFiles mit dem vom Benutzer bereitgestellten Skript zu überprüfen.

SearchElasticsearch

Ein Prozessor, mit dem der Benutzer wiederholt eine paginierte Abfrage (mit Aggregationen) ausführen kann, die mit Elasticsearch JSON DSL geschrieben wurde.

SegmentContent

Segmentiert ein FlowFile in mehrere kleinere Segmente an Byte-Grenzen.

SignContentPGP

Inhalte mit OpenPGP Private Keys signieren

Snowflake

SnowflakeDetectDuplicate

Prüft, ob der Hashwert des FlowFile(der als FlowFile-Attribut angegeben wird) bereits in einer Snowflake-Tabelle enthalten ist und leitet das FlowFile bei einem Treffer an „duplicate“, bei keinem Treffer an „distinct“ und bei Fehlern an „failure“ weiter.

SplitAvro

Teilt eine binär codierte Avro-Datendatei basierend auf der konfigurierten Ausgabegröße in kleinere Dateien auf.

SplitContent

Teilt eingehende FlowFiles nach einer angegebenen Bytefolge auf

SplitExcel

Dieser Prozessor teilt eine Microsoft Excel-Tabelle mit mehreren Blättern in mehrere Microsoft Excel-Tabellen auf, wobei jedes Blatt aus der Originaldatei in eine einzelne Tabelle in einem eigenen FlowFile konvertiert wird.

SplitJson

Teilt eine JSON-Datei in mehrere, separate FlowFiles für ein Array-Element, das durch einen JsonPath-Ausdruck angegeben wird.

SplitRecord

Teilt ein Eingabe-FlowFile, das in einem datensatzorientierten Datenformat vorliegt, in mehrere kleinere FlowFiles.

SplitText

Teilt eine Textdatei in mehrere kleinere Textdateien an Zeilengrenzen auf, die durch die maximale Anzahl von Zeilen oder die Gesamtgröße des Fragments begrenzt sind.

SplitXml

Teilt eine XML-Datei in mehrere separate FlowFiles auf, die jeweils ein untergeordnetes Element oder einen Nachfolgeelement des ursprünglichen Wurzelelements enthalten.

StartAwsPollyJob

Löst einen AWS-Polly-Job aus.

StartAwsTextractJob

Löst einen AWS-Textract-Job aus.

StartAwsTranscribeJob

Lösteinen AWS Transcribe-Job aus.

StartAwsTranslateJob

Löst einen AWS-Translate-Job aus.

StartGcpVisionAnnotateFilesOperation

Triggert eine Vision-Operation bei der Dateieingabe.

StartGcpVisionAnnotateImagesOperation

Triggert eine Vision-Operation bei der Bildeingabe.

Snowflake

SubmitQueryJob

Übermittelt einen Abfragejob an Salesforce unter Verwendung der Funktion Bulk-API 2.

Snowflake

SummarizeText

Dieser Prozessor verwendet ein Large Language Model (LLM), um den Inhalt eines FlowFile zusammenzufassen.

T

Prozessor

Beschreibung

TagS3Object

Fügt ein Tag zu einem Amazon S3-Objekt hinzu oder aktualisiert es.

TailFile

„Hängt“ eine Datei oder eine Liste von Dateien an und nimmt Daten aus der Datei auf, während diese in die Datei geschrieben werden.

TransformXml

Wendet die bereitgestellte XSLT-Datei auf die Nutzdaten von FlowFile XML an.

U

Prozessor

Beschreibung

UnpackContent

Entpackt den Inhalt von FlowFiles, die mit einem von mehreren verschiedenen Verpackungsformaten verpackt wurden, und gibt dabei ein bis mehrere FlowFiles für jedes Eingabe-FlowFile aus.

UpdateAttribute

Aktualisiert die Attribute für ein FlowFile unter Verwendung der Attribute Expression Language und/oder löscht die Attribute auf der Grundlage eines regulären Ausdrucks.

UpdateBoxFileMetadataInstance

Aktualisiert die Werte der Metadatenvorlage für eine Box-Datei anhand des Datensatzes im angegebenen FlowFile.

UpdateByQueryElasticsearch

Aktualisieren Sie Dokumente in einem Elasticsearch-Index mithilfe einer Abfrage.

UpdateCounter

Dieser Prozessor ermöglicht es Benutzern, bestimmte Zähler und Schlüsselpunkte in ihrem Ablauf festzulegen.

UpdateDatabaseTable

Dieser Prozessor verwendet eine JDBC-Verbindung und eingehende Datensätze, um alle Änderungen in der Datenbanktabelle zu erzeugen, die zur Unterstützung der eingehenden Datensätze erforderlich sind.

UpdateRecord

Aktualisiert den Inhalt eines FlowFile, das datensatzorientierte Daten enthält (i.

Snowflake

UpdateSnowflakeDatabase

Aktualisiert die Definition einer Snowflake-Tabelle auf der Grundlage des im eingehenden FlowFile angegebenen Schemas.

Snowflake

UpdateSnowflakeIcebergDatabase

Aktualisiert die Definition einer Snowflake Iceberg-Tabelle.

Snowflake

UpdateTableState

Aktualisiert den Status einer Tabelle im Tabellenstatusdienst.

Snowflake

UpsertMilvus

Fügt für eine bestimmte Sammlung Vektoren in die Milvus-Datenbank ein

Snowflake

UpsertPinecone

Veröffentlicht Vektoren, einschließlich Metadaten und optional Text, in einem Pinecone-Index.

Snowflake

UpsertSFDCObjects

Fügt die Datensätze aus dem eingehenden FlowFile in Salesforce ein

V

Prozessor

Beschreibung

ValidateCsv

Überprüft den Inhalt von FlowFiles oder einen FlowFile Attributwert anhand eines vom Benutzer angegebenen CSV-Schemas.

ValidateJson

Validiert den Inhalt von FlowFiles anhand eines konfigurierbaren JSON-Schemas.

ValidateRecord

Überprüft die Datensätze eines eingehenden FlowFile anhand eines bestimmten Schemas.

ValidateXml

Validiert in einem FlowFile enthaltenes XML.

VerifyContentMAC

Berechnet einen Message Authentication Code unter Verwendung des bereitgestellten Secret Key und vergleicht ihn mit der bereitgestellten MAC-Eigenschaft.

VerifyContentPGP

Überprüft Signaturen mit OpenPGP Public Keys

W

Prozessor

Beschreibung

Warten

Leitet die FlowFiles an die Beziehung „wait“ weiter, bis ein passendes Freigabesignal von einem entsprechenden Notify-Prozessor im verteilten Cache gespeichert wird.

Snowflake

WaitForTableState

Blockiert eingehende FlowFiles solange, bis der entsprechende Tabellenstatus nicht gleich dem akzeptierten Status ist.