<nome_do_modelo>!DETECT_ANOMALIES

Detecta e relata anomalias nos dados de entrada passados para o método. Este é um método do objeto de detecção de anomalia que você cria executando o comando CREATE SNOWFLAKE.ML.ANOMALY_DETECTION.

O método retorna uma tabela que rotula cada linha dos dados de entrada como anômala ou não.

Se você precisar selecionar colunas específicas dos dados retornados por este método, você pode chamar o método na cláusula FROM de uma instrução SELECT. Consulte Seleção de colunas de métodos de instância de classe SQL que retornam dados tabulares.

Sintaxe

<model_name>!DETECT_ANOMALIES(
  INPUT_DATA => <reference_to_data_to_analyze>,
  TIMESTAMP_COLNAME => '<timestamp_column_name>',
  TARGET_COLNAME => '<target_column_name>',
  [ CONFIG_OBJECT => <configuration_object>, ]
  [ SERIES_COLNAME => '<series_column_name>' ]
)
Copy

Nota

model_name é o objeto que você cria executando o comando CREATE SNOWFLAKE.ML.ANOMALY_DETECTION.

Argumentos

Obrigatório:

INPUT_DATA => reference_to_data_to_analyze

Uma referência à tabela, exibição ou consulta que retorna os dados a serem analisados.

Para criar esta referência, você pode usar a palavra-chave TABLE com o nome da tabela, nome da exibição ou consulta, ou você pode chamar a função SYSTEM$REFERENCE ou SYSTEM$QUERY_REFERENCE.

TIMESTAMP_COLNAME => 'timestamp_column_name'

O nome da coluna que contém os carimbos de data/hora (TIMESTAMP_NTZ) nos dados da série temporal.

TARGET_COLNAME => 'target_column_name'

O nome da coluna que contém os dados a serem analisados (tipo NUMERIC ou FLOAT).

Opcional:

SERIES_COLNAME => 'series_column_name'

Nome da coluna que contém o identificador da série (para série temporal múltipla). Esta coluna deve ser uma VARIANT pois pode ser qualquer tipo de valor ou valores de várias colunas em uma matriz.

CONFIG_OBJECT => config_object

Um OBJECT contendo pares chave-valor usados para configurar o trabalho de detecção da anomalia.

Chave

Tipo

Padrão

Descrição

prediction_interval

FLOAT

0,99

Valor entre 0 e 1 que especifica a porcentagem das observações que devem ser marcadas como anomalias:

  • Para uma detecção de anomalias menos rigorosa (ou seja, identificando menos observações marcadas como anomalias), especifique um valor mais alto.

  • Para uma detecção de anomalias mais rigorosa (ou seja, identificando mais observações como anomalias), reduza este valor.

on_error

STRING

'ABORT'

Cadeia de caracteres (constante) que especifica o tratamento do erro para a tarefa de detecção de anomalia. Isto é mais útil ao detectar anomalias em múltiplas séries. Os valores suportados são:

  • 'abort': anule a operação se um erro for encontrado em qualquer série temporal.

  • 'skip': ignore qualquer série temporal em que a detecção de anomalias encontre um erro. Isso permite que a detecção de anomalias seja bem-sucedida em outras séries temporais. As séries que falharam estão ausentes da saída.

Retornos

A função retorna as seguintes colunas:

Nome da coluna

Tipo de dados

Descrição

SERIES

VARIANT

Valor da série (NULL se o modelo foi treinado com séries temporais únicas).

TS

TIMESTAMP_NTZ

Os carimbos de data/hora dos dados

Y

FLOAT

Os valores da série temporal

FORECAST

FLOAT

O valor previsto no carimbo de data/hora.

LOWER_BOUND

FLOAT

O limite inferior do valor dentro do intervalo de previsão. Valores menores que isso são sinalizados como anomalias.

UPPER_BOUND

FLOAT

O limite superior do valor dentro do intervalo de previsão. Valores maiores do que isso são sinalizados como anomalias.

IS_ANOMALY

BOOLEAN

Verdadeiro se o valor for uma anomalia; se não for, falso.

PERCENTILE

FLOAT

O percentil correspondente do valor Y observado dado o intervalo de previsão.

Se o percentil estiver fora de ((1 - alpha) / 2, 1 - (1 - alpha) / 2), o valor será sinalizado como uma anomalia. Por exemplo, se o intervalo de previsão for 0,95, um percentil de 0,96 não seria uma anomalia, mas um percentil de 0,98 seria.

Se o campo prediction_interval não for especificado no objeto de configuração, o padrão será 0,99.

DISTANCE

FLOAT

O múltiplo do desvio padrão da coluna FORECAST (pontuação z)

Notas de uso

  • As colunas para os dados especificados no comando CREATE SNOWFLAKE.ML.ANOMALY_DETECTION (no argumento do construtor INPUT_DATA) deve corresponder às colunas dos dados especificados no argumento INPUT_DATAdeste método.

    Por exemplo, se você tiver passado o argumento SERIES_COLNAME para o comando CREATE SNOWFLAKE.ML.ANOMALY_DETECTION, você também deverá passar o argumento SERIES_COLNAME para este método. Se você tiver omitido o argumento SERIES_COLNAME no comando, você deverá omitir esse argumento aqui.

  • Se os nomes das colunas especificados pelos argumentos TIMESTAMP_COLNAME ou TARGET_COLNAMEnão existirem na tabela, exibição ou consulta especificada pelo argumento INPUT_DATA, ocorre um erro.