StandardOpenAILLMService¶
Description¶
Un Controller Service qui assure l’intégration avec l’API Chat Completion d’OpenAI. Prend en charge les paramètres configurables, notamment la sélection du modèle, la température, le top_p, le nombre maximal de jetons et le comportement de relance. Gère l’authentification API, les tentatives de requêtes avec un backoff exponentiel et la gestion des erreurs.
Propriétés¶
Dans la liste ci-dessous, les propriétés requises sont signalées par un astérisque (*). Les autres propriétés sont considérées comme facultatives. La table indique également les valeurs par défaut et précise si une propriété prend en charge le langage d’expression NiFi.
Nom d’affichage |
Nom d’API |
Valeur par défaut |
Valeurs autorisées |
Description |
---|---|---|---|---|
Délai de base Backoff (ms) * |
Délai de base Backoff (ms) |
1000 |
Délai de base en millisecondes pour le backoff exponentiel entre les tentatives |
|
Nombre maximal de jetons de réponse |
Nombre maximal de jetons de réponse |
Le nombre maximum de jetons à générer dans la réponse. |
||
Nombre maximal de tentatives * |
Nombre maximal de tentatives |
3 |
Nombre maximal de tentatives d’essais pour les appels d’API |
|
Nom du modèle * |
Model Name |
gpt-4o-mini |
Le nom du modèle OpenAI. |
|
Clé d’API OpenAI * |
OpenAI API Key |
La clé d’API pour l’authentification OpenAI. |
||
Seed |
Seed |
La graine à utiliser pour générer la réponse |
||
Temperature |
Temperature |
La température à utiliser pour générer la réponse. |
||
Top P |
Top P |
La valeur top_p pour l’échantillonnage par noyau. Il permet de contrôler la diversité des réponses générées. |
||
Utilisateur |
Utilisateur |
Votre utilisateur final, envoyé à OpenAI pour la surveillance et la détection des abus |
||
Service Web Client * |
Web Client Service |
Le service Web Client à utiliser pour communiquer avec le fournisseur LLM. |
Gestion de l’État¶
Ce composant ne stocke pas d’état.
Restreint¶
Cette composante n’est pas limitée.
Considérations relatives aux ressources du système¶
Ce composant ne précise pas les ressources du système à prendre en compte.