トラブルシューティング¶
このページでは、|sf-intelligence|を使用する際に発生する可能性のある一般的な問題と、それらの問題の解決策に関する情報を提供しています。また、エージェントのパフォーマンスを最適化するためのベストプラクティスと、追加サポートを受ける方法に関する情報も提供しています。
一般的な問題と解決策¶
- 一貫性のない応答
一貫性のない応答は、プロンプトの具体性の不足が原因で最もよく発生します。応答に特定のスタイルや形式を求める場合は、プロンプトで明確に指定します。
LLMsには本質的にある程度のばらつきがありますが、エージェント構成を変更した後にも一貫性のない回答が発生する可能性があります。これを解決するには、エージェント構成、セマンティックビュー構成、チャット履歴、またはモデル選択に対する最近の変更を確認します。
セマンティックモデルを使用している場合は、セマンティックビューに移行する必要があります。セマンティックビューでは作成中の検証が可能なため、セマンティックモデルを使用する場合には気づきにくい不整合の回避に役立ちます。
- ストリーミング応答の問題
あるマシンでストリーミング応答が表示され、別のマシンでは表示されない場合は、ネットワークDPI、スキャンツール、エンドポイントセキュリティソフトウェア、ブラウザー拡張機能など、組織のIT構成が原因である可能性があります。社内のITチームと協力して、これらの問題を解決してください。
- エラー370001
このエラーは、|sf-intelligence|が安全ではないSQLコマンドを生成したことを示しています。|sf-intelligence|はこれらのコマンドを実行せず、代わりにこのエラーを返します。
- アナリストツールのexecution_environmentが設定されていない
これは、ツールがユーザーのデフォルトのウェアハウスに対してSQLクエリを実行するように構成されており、そのユーザーにウェアハウスが設定されていない場合に発生します。これを解決するには、ユーザーにデフォルトのウェアハウスを設定するか、特定のカスタムウェアハウスに対して実行するようにツールを構成します。デフォルトのウェアハウスについて詳しくは、:ref:`label-warehouse_usage_in_sessions`を参照してください。
- 「テーブル/検索サービス/ステージが存在しません」エラー
table / search service / stage does not existエラーが発生した場合、権限に問題がある可能性があります。次の権限が正しく設定されていることを確認します:各セマンティックモデルについて:
ユーザーのデフォルトのロールには、セマンティックモデルステージまたはビュー、およびテーブルのデータベースとスキーマ上でUSAGE 権限が付与されます。
セマンティックモデルを使用する場合、セマンティックモデルファイルを格納するステージでユーザーの既定のロールにREADが付与されます。
セマンティックビューを使用する場合、ユーザーのデフォルトのロールは、セマンティックビューに対して、REFERENCES が付与されます。
セマンティックモデルまたはビューで定義された各テーブルのユーザーのデフォルトのロールに SELECT が付与されます。
各Cortex検索サービスについて:
ユーザーのデフォルトのロールには、Cortex検索サービスのデータベースとスキーマの USAGE が付与されます。
ユーザーには、Cortex検索サービス上の USAGE が付与されます。
- コンテキストとメモリの制限
Cortex Agentは有限のコンテキストウィンドウを使用するため、非常に長い会話では以前のコンテキストが失われます。永続的なコンテキストの場合は、エージェント構成でカスタム指示を使用します。
パフォーマンスの最適化¶
- 応答時間の問題
Snowflake IntelligenceはLLMsとクエリを使用して複雑な一連の推論タスク、取得タスク、および分析タスクを実行するため、応答のレイテンシは変動する可能性があります。パフォーマンスは、Snowflakeウェアハウスの負荷とLLMサービス自体の影響を受ける可能性があります。リクエストの完了には1分以上かかることがよくあります。パフォーマンスを向上させるには、label_snowflake_intelligence_build_cross-region`が有効になっていることを確認し、:ref:`label_snowflake_intelligence_build_model`で「自動」モデルを使用し、検証済みクエリのさらなる追加を検討します。検証済みクエリについて詳しくは、:doc:/user-guide/snowflake-cortex/cortex-analyst/verified-query-repository`を参照してください。
- タイムアウトの問題
まず、報告されているインシデントがないか、
Snowflakeステータスページ<https://status.snowflake.com/>`_を確認します。GPUコンピューティングリソースが限られているクラウドリージョンで|sf-intelligence|が実行されている場合にも、リクエストがタイムアウトする可能性があります。単一リージョン内の制限を回避するために、:doc:/user-guide/snowflake-cortex/cross-region-inference`を有効にすることをお勧めします。- 並列リクエスト
エージェントにCortex AnalystやCortex Searchなどのツール呼び出しを並行して実行するようにリクエストできます。エージェントのオーケストレーション指示:doc:`/user-guide/snowflake-cortex/cortex-agents-manage`に次を追加します。
OVERALL: parallelize as many tool calls as possible for latency purposes.
オーケストレーション指示について詳しくは、:ref:`label_snowflake_agents_orchestration`を参照してください。
- モデル選択
エージェントを作成する際に、エージェントが使用するモデルを直接指定できます。Cortex SearchツールやCortex Analystツールでは、モデルを直接指定できません。代わりに、ロールベースのアクセス制御(RBAC)を使用して、これらのツールが使用できるモデルを制限できます。詳細については、 ロールベースのアクセス制御(RBAC) をご参照ください。
- 同じツールへの複数回の呼び出し
生成されるクエリが大きい場合、サイズ制限がトリガーされて再試行が発生することがあります。Cortex Analystではクエリに対して2048トークンの生成制限があり、これによってサイズ制限がトリガーされる可能性があります。エージェントへのカスタム応答指示が多すぎる場合も、サイズ制限がトリガーされる可能性があります。
- ウェアハウスのサイズ
Snowflake Intelligenceは、最良の回答を作成し、必要に応じてツールを呼び出すために、LLMベースの一連の意思決定を行います。ウェアハウスの割り当てを大きくしても、それらの意思決定のパフォーマンスに影響を与えることはできません。
ただし、Snowflake Intelligenceリクエストの一部としてCortex Analystツールを実行する場合、そのリクエストはウェアハウスを使用して実行されるSQLクエリに変換されます。ウェアハウスが小さすぎたり過負荷であったりする場合は、パフォーマンスに悪影響を与えます。
- オーケストレーション指示とツールの説明を改善する
ツールとオーケストレーションに関する問題を解決するには、問題の説明と期待される結果、および既存の説明または指示を含めてLLMにプロンプトを出します。LLMは、新しいプロンプトの作成を自動化するのに役立ちます。
- 検証済みクエリを使用する
一般的なクエリや複雑なクエリに対して予測可能な結果が得られるように、検証済みクエリをセマンティックビューに追加します。これにより、エージェントはこれらのリクエストに対して、最適化された予測可能なクエリパスを使用できるようになります。
- レイテンシのボトルネックを特定する
エージェントの応答が遅い原因を診断するには、Snowsightのエージェントモニタリングのタブを使用して、レイテンシのボトルネックを特定できます。これらのトレースは、エージェントがたどった論理パスと、各ステップの所要時間を示します。エージェントのモニタリングについて詳しくは、:doc:`/user-guide/snowflake-cortex/cortex-agents-monitor`を参照してください。
サポートを受ける¶
|sf-intelligence|に関するサポートを受けるには、:doc:`Snowsightのサポートページ</user-guide/ui-support>`を使用できます。さらにサポートが必要な場合は、`Snowflakeフォーラム<https://snowflake.discourse.group/c/ai-agents-snowflake-intelligence/103>`_にアクセスすることもできます。