Problembehandlung¶

Auf dieser Seite finden Sie Informationen zu häufigen Problemen, die bei der Verwendung von Snowflake Intelligence auftreten können, sowie Lösungen für diese Probleme. Außerdem finden Sie hier Informationen über bewährte Verfahren zur Optimierung der Leistung Ihrer Agenten und wie Sie zusätzlichen Support erhalten können.

Häufige Probleme und Lösungen¶

Inkonsistente Antworten

Inkonsistente Antworten werden in den meisten Fällen durch einen Mangel an Spezifizierung bei Prompts verursacht. Um einen bestimmten Stil oder ein bestimmtes Format für Ihre Antwort zu erhalten, geben Sie dies im Prompt deutlich an.

Während LLMs inhärent eine gewissen Varianz aufweisen, können inkonsistente Antworten auch nach Änderungen an der Konfiguration des Agenten auftreten. Um dies zu beheben, prüfen Sie die Agentenkonfiguration, die Konfiguration der semantischen Ansicht, den Chat-Verlauf oder die Modellauswahl auf kürzlich vorgenommene Änderungen.

Wenn Sie ein semantisches Modell verwenden, sollten Sie zu einer semantischen Ansicht übergehen. Semantische Ansichten ermöglichen eine Validierung während der Erstellung, um Inkonsistenzen zu vermeiden, die bei der Verwendung eines semantischen Modells weniger offensichtlich sind.

Probleme bei der Streaming-Antwort

Wenn Sie eine Streaming-Antwort auf einem Computer sehen, aber nicht auf einem anderen, liegt das wahrscheinlich an den IT-Konfigurationen Ihres Unternehmens, wie z. B. Netzwerk-DPI, Scan-Tools, Endpunkt-Sicherheitssoftware oder Browser-Erweiterungen. Arbeiten Sie mit Ihrem internenIT-Team zusammen, um diese Probleme zu lösen.

Error 370001

Dieser Fehler zeigt an, dass Snowflake Intelligence einen unsicheren SQLBefehl generiert hat. Snowflake Intelligence führt diese Befehle nicht aus und gibt stattdessen diesen Fehler zurück.

Execution_environment not populated for analyst tool

Dies tritt auf, wenn das Tool für die Ausführung von SQL-Abfragen für das Standard-Warehouse des Benutzenden konfiguriert ist und für den Benutzenden kein Warehouse festgelegt ist. Um dies zu beheben, legen Sie entweder ein Standard-Warehouse für den Benutzenden fest, oder konfigurieren Sie das Tool so, dass es auf einem bestimmten kundenspezifischen Warehouse ausgeführt wird. Weitere Informationen zu Standard-Warehouses finden Sie unter Warehouse-Nutzung in Sitzungen.

„Table / search service / stage does not exist“ errors

Wenn Sie auf Fehler des Typs table / search service / stage does not exist stoßen, liegt möglicherweise ein Problem mit der Berechtigung vor. Überprüfen Sie, ob die folgenden Berechtigungen korrekt eingestellt sind:

Für jedes semantische Modell:
- Der Standardrolle des Benutzers wird die Berechtigung USAGE für die Datenbank und das Schema des Stagingbereichs oder der Ansicht des semantischen Modells und der Tabelle gewährt.
- Wenn Sie ein semantisches Modell verwenden, wird der Standardrolle des Benutzenden die Berechtigung READ für den Stagingbereich gewährt, in dem die Datei des semantischen Modells gespeichert ist.
- Wenn Sie eine semantische Ansicht verwenden, wird der Standardrolle des Benutzers die Berechtigung REFERENCES für die semantische Ansicht gewährt.
- Der Standardrolle des Benutzers wird die Berechtigung SELECT für jede im semantischen Modell oder in der Ansicht definierte Tabelle gewährt.
Für jeden Cortex Search Service:
- Der Standardrolle des Benutzers wird die Berechtigung USAGE für die Datenbank und das Schema des Cortex Search Service gewährt.
- Dem Benutzer die Berechtigung USAGE für den Cortex Search Service gewährt.

Kontext- und Speichergrenzen

Cortex Agents verwenden ein endliches Kontextfenster, sodass bei sehr langen Konversationen der frühere Kontext verloren geht. Verwenden Sie für einen persistenten Kontext die kundenspezifischen Anweisungen in der Agentenkonfiguration.

Leistungsoptimierung¶

Probleme mit der Antwortzeit

Die Antwortlatenz kann variieren, da Snowflake Intelligence eine komplizierte Reihe von Reasoning-, Abruf- und Analyseaufgaben mit LLMs und Abfragen ausführt. Die Leistung kann durch die Auslastung des Snowflake-Warehouses und durch die LLM-Dienste selbst beeinträchtigt werden. Die Bearbeitung von Anfragen dauert oft länger als eine Minute. Stellen Sie für eine bessere Leistung sicher, dass Regionenübergreifende Inferenz aktiviert ist, verwenden Sie das „automatische“ Modell im:ref:label_snowflake_intelligence_build_model, und erwägen Sie, weitere geprüfte Abfragen hinzuzufügen. Weitere Informationen über verifizierte Abfragen finden Sie unter Cortex Analyst Geprüftes Abfrage-Repository.

Timeout-Probleme

Überprüfen Sie zunächst die Snowflake-Statusseite auf gemeldete Vorfälle. Ihre Anforderungen können auch ein Zeitlimit überschreiten, wenn Snowflake Intelligence in einer Cloudregion mit eingeschränkten GPU-Computeressourcen ausgeführt wird. Wir empfehlen, Regionenübergreifende Inferenz zu aktivieren, um Beschränkungen innerhalb einer einzelnen Region zu vermeiden.

Parallele Anfragen

Sie können anfordern, dass der Agent Tool-Aufrufe, wie Cortex Analyst und Cortex Search, parallel ausführt. Fügen Sie Folgendes zu den Anweisungen für die Orchestrierung von Agenten hinzu Agents konfigurieren und mit ihnen interagieren:

OVERALL: parallelize as many tool calls as possible for latency purposes.

Anleitungen zur Orchestrierung finden Sie unter Orchestrierung angeben.

Modellauswahl

Beim Erstellen eines Agenten können Sie direkt das Modell angeben, das der Agent verwenden soll. Sie können das Modell nicht direkt für die Tools Cortex Search oder Cortex Analyst angeben. Stattdessen können Sie eine rollenbasierte Zugriffssteuerung (Role-based Access Control, RBAC) verwenden, um einzuschränken, welche Modelle diese Tools verwenden können. Weitere Informationen dazu finden Sie unter Rollenbasierte Zugriffssteuerung (RBAC).

Mehrere Aufrufe für dasselbe Tool

Wenn generierte Abfragen groß sind, können sie manchmal Größenbeschränkungen auslösen, die eine Wiederholung verursachen. Cortex Analyst hat ein Generierungslimit von 2.048 Token für Abfragen, das die Größenbeschränkung auslösen kann. Viele kundenspezifische Antwortanweisungen für Agenten können ebenfalls die Größenbeschränkung auslösen.

Warehouse-Größe

Snowflake Intelligence trifft eine Reihe von LLM-basierten Entscheidungen, um je nach Bedarf die besten Antwort- und Aufruf-Tools zu erstellen. Sie können die Leistung dieser Entscheidungen nicht mit einer größeren Warehouse-Zuteilung beeinflussen.

Wenn Sie jedoch ein Cortex Analyst-Tool als Teil einer Snowflake Intelligence-Anforderung ausführen, wird die Anforderung in SQL-Abfragen übersetzt, die über Ihr Warehouse ausgeführt werden. Wenn das Warehouse zu klein oder überlastet ist, wirkt sich das negativ auf die Leistung aus.

Verbessern der Orchestrierungsanweisungen und Toolbeschreibungen

Um Probleme mit Tools und der Orchestrierung zu lösen, prompten Sie ein LLM für eine Erläuterung des Problems und das gewünschte Ergebnis sowie die vorhandene Beschreibung oder angegebene Anweisungen. Das LLM kann Sie beim Automatisieren des neuen Prompts unterstützen.

Geprüfte Abfragen verwenden

Um vorhersagbare Ergebnisse bei häufigen oder komplexen Abfragen sicherzustellen, fügen Sie verifizierte Abfragen zu Ihrer semantischen Ansicht hinzu. Dadurch wird sichergestellt, dass der Agent für diese Anforderungen einen optimierten und vorhersehbaren Abfragepfad verwendet.

Latenz-Engpässe identifizieren

Um langsame Antworten von Agenten zu diagnostizieren, können Sie die Registerkarte zur Überwachung der Agenten in Snowsight verwenden und so Latenzengpässe erkennen. Diese Ablaufverfolgungen zeigen den logischen Pfad, den der Agent genommen hat, und wie lange jeder Schritt gedauert hat. Weitere Informationen zur Agentenüberwachung finden Sie unter Cortex Agent-Anfragen überwachen.

Unterstützung erhalten¶

Unterstützung für Snowflake Intelligence erhalten Sie auf der :doc:` Support-Seite in Snowsight</user-guide/ui-support>`. In den Snowflake Foren erhalten Sie ebenfalls weitere Hilfe.