Solução de problemas¶

Esta página fornece informações sobre problemas comuns que você pode encontrar ao trabalhar com o Snowflake Intelligence e as respectivas soluções. Ela também apresenta informações sobre as práticas recomendadas para otimizar o desempenho dos agentes e como obter suporte adicional.

Problemas comuns e soluções¶

Respostas inconsistentes

As respostas inconsistentes são mais causadas pela falta de especificidade nos prompts. Para obter um estilo ou formato específico para sua resposta, especifique-o claramente no prompt.

Enquanto houver qualquer variação inerente nos LLMs, respostas inconsistentes também poderão ocorrer após alterações na configuração do agente. Para resolver isso, verifique se há alterações recentes na configuração do seu agente, na configuração da exibição semântica, no histórico de bate-papo ou na seleção de modelo.

Se você usa um modelo semântico, convém fazer a transição para uma exibição semântica. As exibições semânticas permitem a validação durante a criação para ajudar a evitar inconsistências que são menos óbvias ao usar um modelo semântico.

Problemas de resposta de streaming

Se você vê uma resposta de streaming em uma máquina, mas não em outra, provavelmente é por causa das configurações de IT da sua organização, como DPI de rede, ferramentas de verificação, software de segurança de ponto de extremidade ou extensões de navegador. Trabalhe com sua equipe de IT interna para resolver esses problemas.

Erro 370001

Esse erro indica que o Snowflake Intelligence gerou um comando SQL não seguro. O Snowflake Intelligence não executa esses comandos e, em vez disso, retorna esse erro.

Execution_environment não preenchido para a ferramenta de análise

Isso ocorre quando a ferramenta é configurada para executar consultas SQL no warehouse padrão do usuário, e o usuário não tem um warehouse definido. Para resolver isso, defina um warehouse padrão para o usuário ou configure a ferramenta para ser executada em um warehouse personalizado específico. Para obter mais informações sobre warehouses padrão, consulte Uso de warehouses em sessões.

Erros de «tabela/serviço de pesquisa/área de preparação que não existe»

Se você encontrar erros como table / search service / stage does not exist, talvez haja problemas de privilégio. Verifique se os seguintes privilégios estão definidos corretamente:

Para cada modelo semântico:
- A função padrão do usuário recebe USAGE no banco de dados e no esquema da área de preparação ou exibição do modelo semântico e da tabela.
- Se um modelo semântico é usado, a função padrão do usuário recebe o valor READ na área de preparação que armazena o arquivo do modelo semântico.
- Se você usa uma exibição semântica, a função padrão do usuário recebe o valor REFERENCES na exibição semântica.
- A função padrão do usuário recebe SELECT para cada tabela definida no modelo ou exibição semânticos.
Para cada Cortex Search Service:
- A função padrão do usuário recebe USAGE no banco de dados e no esquema do Cortex Search Service.
- O usuário recebe USAGE no Cortex Search Service.

Limites de contexto e memória

Os Cortex Agents usam uma janela de contexto finita, portanto, conversas muito longas perderão o contexto mais antigo. Para contexto persistente, use as instruções personalizadas na configuração do agente.

Otimização de desempenho¶

Problemas de tempo de resposta

A latência da resposta pode variar porque o Snowflake Intelligence realiza uma série de tarefas complicadas de raciocínio, recuperação e análise usando LLMs e consultas. O desempenho pode ser afetado pela carga em seu warehouse Snowflake e pelos próprios serviços de LLM. As solicitações geralmente levam mais de um minuto para serem concluídas. Para obter um melhor desempenho, certifique-se de que Inferência entre regiões esteja habilitado, use o modelo «auto» em Seleção do modelo e considere adicionar outras consultas verificadas. Para obter mais informações sobre consultas verificadas, leia Cortex Analyst Verified Query Repository.

Problemas de tempo limite

Primeiro, consulte a página de status do Snowflake para verificar se há incidentes relatados. Suas solicitações também poderão atingir o tempo limite se o Snowflake Intelligence estiver sendo executado em uma região de nuvem com recursos de computação de GPU limitados. Recomendamos habilitar Inferência entre regiões para evitar limitações dentro de uma única região.

Solicitações paralelas

É possível solicitar que o agente execute chamadas para ferramentas, como Cortex Analyst e Cortex Search, em paralelo. Adicione o seguinte às instruções de orquestração do agente Configuração e interação com Agents:

OVERALL: parallelize as many tool calls as possible for latency purposes.

Para obter informações sobre instruções de orquestração, consulte Especificação da orquestração.

Seleção de modelo

Ao criar um agente, você pode especificar diretamente o modelo que o agente deve usar. Não é possível especificar diretamente o modelo para as ferramentas Cortex Search ou Cortex Analyst. Em vez disso, você pode usar o controle de acesso baseado em função (Role-Based Access Control, RBAC) para limitar quais modelos essas ferramentas podem usar. Para obter mais informações, consulte Controle de acesso baseado em função (RBAC).

Várias chamadas para a mesma ferramenta

Quando as consultas geradas são grandes, às vezes elas podem acionar limites de tamanho, causando uma nova tentativa. O Cortex Analyst tem um limite de geração de 2.048 tokens para consultas, que pode acionar o limite de tamanho. Muitas instruções de resposta personalizadas do agente também podem acionar o limite de tamanho.

Tamanho do warehouse

O Snowflake Intelligence toma uma série de decisões baseadas em LLM para criar a melhor resposta e chamar as ferramentas conforme necessário. Você não pode impactar o desempenho dessas decisões com uma alocação de warehouse maior.

No entanto, ao executar uma ferramenta Cortex Analyst como parte de uma solicitação do Snowflake Intelligence, a solicitação é convertida em consultas SQL que são executadas usando seu warehouse. Se o seu warehouse for muito pequeno ou estiver sobrecarregado, isso prejudicará o desempenho.

Melhorar as instruções de orquestração e as descrições de ferramentas

Para resolver problemas com ferramentas e orquestração, envie um prompt para um LLM com a explicação do problema e o resultado desejado, bem como a descrição ou as instruções existentes. O LLM pode ajudar a automatizar a criação do novo prompt.

Usar consultas verificadas

Para garantir resultados previsíveis para consultas comuns ou complexas, adicione consultas verificadas à sua exibição semântica. Isso garante que o agente use um caminho de consulta otimizado e previsível para essas solicitações.

Identificar gargalos de latência

Para diagnosticar respostas lentas de agentes, é possível usar a guia de monitoramento do agente no Snowsight para identificar gargalos de latência. Esses rastreamentos mostram o caminho lógico que o agente seguiu e quanto tempo durou cada etapa. Para obter mais informações sobre monitoramento de agente, consulte Monitoramento de solicitações de Cortex Agents.

Obtendo suporte¶

Para obter suporte para o Snowflake Intelligence, você pode usar a página de suporte no Snowsight. Você também pode acessar os fóruns do Snowflake para obter mais ajuda.