Résolution des problèmes¶

Cette page fournit des informations sur les problèmes courants que vous pouvez rencontrer lorsque vous travaillez avec Snowflake Intelligence, ainsi que des solutions à ces problèmes. Elle fournit également des informations sur les bonnes pratiques pour optimiser les performances de vos agents et sur la manière d’obtenir une assistance supplémentaire.

Problèmes courants et solutions¶

Réponses incohérentes

Les réponses incohérentes sont le plus souvent causées par un manque de spécificité dans les invites. Pour obtenir un style ou un format spécifique pour votre réponse, indiquez-le clairement dans l’invite.

Si les LLMs présentent intrinsèquement une certaine variabilité, des réponses incohérentes peuvent également survenir à la suite de modifications apportées à la configuration de l’agent. Pour résoudre ce problème, vérifiez les modifications récentes apportées à la configuration de votre agent, à la configuration de la vue sémantique, à l’historique des conversations ou à la sélection du modèle.

Si vous utilisez un modèle sémantique, vous devez passer à une vue sémantique. Les vues sémantiques permettent d’effectuer une validation lors de la création afin d’éviter les incohérences qui sont moins évidentes lorsqu’on utilise un modèle sémantique.

Problèmes de réponse en continu

Si vous constatez une réponse en continu sur une machine mais pas sur une autre, cela est probablement dû aux configurations IT de votre organisation, telles que le DPI de réseau, les outils d’analyse, les logiciels de sécurité des terminaux ou les extensions de navigateur. Travaillez avec votre équipe IT interne pour résoudre ces problèmes.

Erreur 370001

Cette erreur indique que Snowflake Intelligence a généré une commande SQL non sécurisée. Snowflake Intelligence n’exécute pas ces commandes et renvoie à la place cette erreur.

Execution_environment non renseigné pour l’outil d’analyse

Cela se produit lorsque l’outil est configuré pour exécuter des requêtes SQL sur l’entrepôt par défaut de l’utilisateur et que l’utilisateur n’a pas d’entrepôt défini. Pour résoudre ce problème, vous pouvez soit définir un entrepôt par défaut pour l’utilisateur, soit configurer l’outil pour qu’il s’exécute sur un entrepôt personnalisé spécifique. Pour plus d’informations sur les entrepôts par défaut, voir Utilisation d’entrepôts dans les sessions.

Erreurs « La table/le service de recherche/la zone de préparation n’existe pas »

Si vous rencontrez des erreurs table / search service / stage does not exist, il se peut qu’il y ait des problèmes de privilège. Vérifiez que les privilèges suivants sont correctement définis :

Pour chaque modèle sémantique :
- Le rôle par défaut de l’utilisateur est accordé à USAGE sur la base de données et le schéma de la zone de préparation ou de la vue du modèle sémantique, et la table.
- Si vous utilisez un modèle sémantique, le rôle par défaut de l’utilisateur est READ sur la zone de préparation qui stocke le fichier du modèle sémantique.
- Si vous utilisez une vue sémantique, le rôle par défaut de l’utilisateur est REFERENCES sur la vue sémantique.
- Le rôle par défaut de l’utilisateur est accordé à SELECT pour chaque table définie dans le modèle ou la vue sémantique.
Pour chaque Cortex Search Service :
- Le rôle par défaut de l’utilisateur est accordé à USAGE sur la base de données et le schéma du Cortex Search Service.
- L’utilisateur se voit accorder le rôle USAGE sir le Cortex Search Service.

Limites de contexte et de mémoire

Les Agents Cortex utilisent une fenêtre de contexte limitée ; par conséquent, les conversations très longues perdront le contexte antérieur. Pour conserver le contexte, utilisez des instructions personnalisées dans la configuration de l’agent.

Optimisation des performances¶

Problèmes de temps de réponse

La latence des réponses peut varier car Snowflake Intelligence effectue une série complexe de tâches de raisonnement, de récupération et d’analyse à l’aide de LLMs et de requêtes. Les performances peuvent être affectées par la charge pesant sur votre entrepôt Snowflake et par les services LLM eux-mêmes. Les requêtes prennent souvent plus d’une minute pour être traitées. Pour de meilleures performances, assurez-vous que Inférence interrégionale est activé, utilisez le modèle « auto » dans votre Sélection de modèles, et envisagez d’ajouter des requêtes vérifiées supplémentaires. Pour plus d’informations sur les requêtes vérifiées, voir Cortex Analyst Référentiel de requêtes vérifiées.

Problèmes de délai d’expiration

Tout d’abord, consultez la page d’état de Snowflake pour tout incident signalé. Vos requêtes peuvent également expirer si Snowflake Intelligence s’exécute dans une région Cloud disposant de ressources de calcul GPU limitées. Nous recommandons d’activer Inférence interrégionale pour éviter les limitations au sein d’une même région.

Requêtes parallèles

Vous pouvez demander à l’agent d’exécuter des appels d’outils, tels que Cortex Analyst et Cortex Search, en parallèle. Ajoutez ce qui suit aux instructions d’orchestration de l’Agent Configurer des agents et interagir avec :

OVERALL: parallelize as many tool calls as possible for latency purposes.

Pour plus d’informations sur les instructions d’orchestration, voir Spécifier l’orchestration.

Sélection de modèles

Lors de la création d’un agent, vous pouvez spécifier directement le modèle que l’agent doit utiliser. Vous ne pouvez pas spécifier directement le modèle pour les outils Cortex Search ou Cortex Analyst. Au lieu de cela, vous pouvez utiliser un contrôle d’accès basé sur les rôles (RBAC) pour limiter les modèles que ces outils peuvent utiliser. Pour plus d’informations, voir contrôle d’accès basé sur les rôles (RBAC).

Plusieurs appels vers le même outil

Lorsque les requêtes générées sont volumineuses, elles peuvent parfois déclencher des limites de taille, ce qui entraîne une nouvelle tentative. Cortex Analyst impose une limite de 2 048 jetons pour la génération de requêtes, ce qui peut entraîner le dépassement de la limite de taille. Un grand nombre d’instructions de réponse d’agent personnalisées peuvent également déclencher la limite de taille.

Taille d’entrepôt

Snowflake Intelligence prend une série de décisions basées sur des LLM afin de générer la meilleure réponse possible et de faire appel à des outils si nécessaire. Une augmentation de l’allocation d’entrepôt n’aura aucune incidence sur la performance de ces décisions.

Toutefois, lors de l’exécution d’un outil Cortex Analyst dans le cadre d’une requête Snowflake Intelligence, la demande est traduite en requêtes SQL qui sont exécutées à l’aide de votre entrepôt. Si votre entrepôt est trop petit ou surchargé, cela a un impact négatif sur les performances.

Amélioration des instructions d’orchestration et des descriptions d’outils

Pour résoudre les problèmes liés aux outils et à l’orchestration, fournissez à un LLM une explication du problème et du résultat souhaité, ainsi que la description ou les instructions existantes. Le LLM peut aider à automatiser la création de la nouvelle invite.

Utiliser des requêtes vérifiées

Pour garantir des résultats prévisibles pour les requêtes courantes ou complexes, ajoutez des requêtes vérifiées à votre vue sémantique. Cela garantit que l’agent utilise un chemin de requête optimisé et prévisible pour ces requêtes.

Identifier les goulots d’étranglement de latence

Pour diagnostiquer les réponses lentes des agents, vous pouvez utiliser l’onglet de surveillance des agents dans Snowsight afin d’identifier les goulots d’étranglement de latence. Ces traces indiquent le chemin logique suivi par l’agent et la durée de chaque étape. Pour plus d’informations sur la surveillance des agents, voir Surveiller les requêtes des Agents Cortex.

Obtenir de l’aide¶

Pour obtenir de l’aide pour Snowflake Intelligence, accédez à la page d’assistance dans Snowsight. Vous pouvez également vous rendre sur les forums Snowflake pour obtenir une aide supplémentaire.