- Categorias:
Funções de cadeia de caracteres e binários (Large Language Model)
CLASSIFY_TEXT (SNOWFLAKE.CORTEX)¶
Classifica dados de texto de forma livre em categorias fornecidas por você.
Sintaxe¶
SNOWFLAKE.CORTEX.CLASSIFY_TEXT( <input> , <list_of_categories> )
Argumentos¶
Obrigatório:
input
Cadeia de caracteres a ser classificada. A cadeia de caracteres de entrada diferencia maiúsculas de minúsculas. É possível obter resultados diferentes para a mesma cadeia de caracteres que usa capitalização diferente.
list_of_categories
Matriz de cadeias de caracteres que representam as categorias. Deve conter no mínimo duas e no máximo 100 categorias exclusivas. As categorias diferenciam maiúsculas de minúsculas. Se esses requisitos não forem atendidos, a função retornará uma mensagem de erro. Para uma lista completa de erros, consulte Condições de erro.
Retornos¶
Retorna uma cadeia de caracteres com um objeto JSON. O objeto JSON contém a categoria na qual o prompt de entrada foi classificado. Se argumentos inválidos forem fornecidos, um erro será retornado. Para detalhes sobre os erros, consulte Condições de erro.
Requisitos de controle de acesso¶
Os usuários devem usar uma função que tenha a função do banco de dados SNOWFLAKE.CORTEX_USER. Consulte Privilégios obrigatórios para obter mais informações sobre esse privilégio.
Notas de uso¶
Para um desempenho ideal, siga estas diretrizes:
Use texto simples em inglês para entrada e categorias.
Limite a quantidade de texto que não esteja em inglês simples no texto de entrada. Por exemplo, tente limitar conteúdo como trechos de código ou logs na entrada de texto.
O texto não deve conter código ou formatos que não sejam de código aberto (linguagens específicas da empresa, formatos proprietários etc.). A função não retornará um erro, mas os resultados podem não ser os esperados.
Não use abreviações, caracteres especiais ou jargões nos rótulos das categorias.
As categorias devem ser descritivas. Por exemplo, usar uma categoria como
Xa4s3
oucategory 1
não produzirá bons resultados.As categorias devem ser mutuamente exclusivas.
Exemplos¶
O exemplo a seguir classifica o prompt em uma das duas categorias, travel
ou cooking
:
SELECT SNOWFLAKE.CORTEX.CLASSIFY_TEXT('One day I will see the world', ['travel', 'cooking']);
{
"label": "travel"
}
O exemplo a seguir cria uma tabela, text_classification_table
, que contém uma coluna para texto e uma coluna para possíveis categorias para esse texto. Em seguida, a função CLASSIFY_TEXT é chamada em cada linha da tabela para classificar a cadeia de caracteres na coluna de texto.
CREATE OR REPLACE TEMPORARY TABLE text_classification_table AS
SELECT 'France' AS input, ['North America', 'Europe', 'Asia'] AS classes
UNION ALL
SELECT 'Singapore', ['North America', 'Europe', 'Asia']
UNION ALL
SELECT 'one day I will see the world', ['travel', 'cooking', 'dancing']
UNION ALL
SELECT 'my lobster bisque is second to none', ['travel', 'cooking', 'dancing'];
SELECT input,
classes,
SNOWFLAKE.CORTEX.CLASSIFY_TEXT(input, classes)['label'] as classification
FROM text_classification_table;