Registro de modelo Snowflake¶

Nota

A API do registro de modelos descrita neste tópico está geralmente disponível como pacote snowflake-ml-python versão 1.5.0.

Após o treinamento de seu modelo, a operacionalização do modelo e a execução da inferência no Snowflake começam com o registro do modelo no Snowflake Model Registry. O Model Registry permite que você gerencie com segurança os modelos e seus metadados no Snowflake, independentemente da origem e do tipo, e facilita a execução da inferência.

Importante

O Snowflake Model Registry funciona com modelos de aprendizado de máquina desenvolvidos em Python para o ecossistema de ML do Snowflake. Modelos treinados usando funções de ML do Snowflake (por exemplo, FORECAST) não aparecem no registro de modelos. Alguns tipos de modelos, como LLMs com Cortex Fine-Tuning, aparecem na UI do Snowsight do registro de modelos, mas não são gerenciados pela API do registro de modelos.

Oe Snowflake Model Registry oferece os seguintes recursos:

Armazena e gerencia versões de modelo, métricas de modelo e metadados de modelo.
Exibe modelos e executa inferência distribuída em grande escala usando Python, SQL ou pontos de extremidade de API REST
Gerencia o ciclo de vida do modelo com opções de governança flexíveis e trabalho com modelos de ambientes de desenvolvimento a produção.
Monitora o desempenho e o desvio do modelo usando o Snowflake ML Observability.
Gerencia com segurança o acesso ao modelo com controle de acesso baseado em funções (RBAC).

O registro de modelos armazena modelos de aprendizado de máquina como objetos de nível de esquema de primeira classe no Snowflake.

Depois de registrar um modelo, você pode invocar seus métodos (equivalentes a funções ou procedimentos armazenados) para realizar operações de modelo, como inferência, em um warehouse virtual do Snowflake, ou servir o modelo no Snowpark Container Services para inferência baseada em GPU.

O Snowflake Model Registry tem suporte para tipos incorporados para os tipos de modelos mais comuns, incluindo scikit-learn, xgboost, LightGBM, PyTorch, TensorFlow, pipelines do Hugging Face e MLFlow modelos pyfunc. O Model Registry também é flexível e poderoso o suficiente para suportar seus próprios modelos previamente treinados, bem como qualquer código de processamento personalizado.

Dica

Veja exemplos desses tipos de modelos com fluxos de trabalho de ponta a ponta em Exemplos e guias de início rápido.

As principais classes da Snowflake Model Registry Python API são:

snowflake.ml.registry.Registry: gerencia modelos dentro de um esquema.
snowflake.ml.model.Model: representa um modelo.
snowflake.ml.model.ModelVersion: representa uma versão de um modelo.

Este tópico descreve como realizar operações de registro em Python usando a biblioteca snowflake-ml-python. Você também pode realizar muitas operações de registro em SQL; consulte Model Registry SQL.

Privilégios obrigatórios¶

Para criar um modelo, você deve possuir o esquema onde o modelo foi criado ou ter o privilégio CREATE MODEL nele. Para usar um modelo, você deve possuir o modelo ou ter o privilégio USAGE ou READ nele.

O privilégio USAGE permite que os beneficiários usem o modelo para inferência do warehouse sem poder ver nenhum de seus componentes internos.
O privilégio READ permite que os beneficiários usem o modelo para inferência de SPCS e também vê seus metadados, como comentários, tags e métricas.

Para fornecer aos usuários acesso de USAGE a todos os modelos existentes em um esquema, use GRANT USAGE ON ALL MODELS IN SCHEMA <schema> TO ROLE <role>. Você também pode dar aos usuários acesso a modelos futuros criados em um esquema automaticamente por meio de GRANT USAGE ON FUTURE MODELS IN SCHEMA <schema> TO ROLE <role>;.

Da mesma forma, você pode dar aos usuários acesso de READ a todos os modelos existentes ou futuros em um esquema usando a mesma sintaxe, mas substituindo USAGE por READ.

Se a função de um usuário tiver privilégio OWNER, USAGE ou READ em um modelo, ele aparecerá na página de registro de modelos do Snowsight. Para obter detalhes sobre como os privilégios funcionam no Snowflake, consulte Privilégios de controle de acesso.

Limitações atuais¶

Os seguintes limites se aplicam a modelos e versões de modelo.

Modelos	Máximo de 1.000 versões
Versões do modelo	Máximo de 10 métodos Máximo de 500 argumentos por método Metadados máximos (incluindo métricas) de 100 KB Tamanho total máximo do modelo de 5 GB (para modelos implantados em warehouse) Tamanho máximo do arquivo de configuração de 250 KB, incluindo `conda.yml` e outros arquivos de manifesto que `log_model` gera internamente. (Se um modelo tiver muitas funções e todas elas tiverem muitos argumentos, por exemplo, esse limite poderá ser excedido.)

Modelos

Máximo de 1.000 versões

Versões do modelo

Máximo de 10 métodos
Máximo de 500 argumentos por método
Metadados máximos (incluindo métricas) de 100 KB
Tamanho total máximo do modelo de 5 GB (para modelos implantados em warehouse)
Tamanho máximo do arquivo de configuração de 250 KB, incluindo conda.yml e outros arquivos de manifesto que log_model gera internamente. (Se um modelo tiver muitas funções e todas elas tiverem muitos argumentos, por exemplo, esse limite poderá ser excedido.)

Abertura do registro de modelo do Snowflake¶

Os modelos são objetos Snowflake de primeira classe e podem ser organizados em um banco de dados e esquema junto com outros objetos Snowflake. O Registro de modelo Snowflake fornece uma classe Python para gerenciar modelos dentro de um esquema. Assim, qualquer esquema Snowflake pode ser usado como registro. Não é necessário inicializar ou preparar um esquema para essa finalidade. Snowflake recomenda a criação de um ou mais esquemas dedicados para essa finalidade, como ML.REGISTRY. Você pode criar o esquema usando CREATE SCHEMA.

Antes de poder criar ou modificar modelos no registro, você deve abrir o registro. A abertura do registro retorna uma referência a ele, que você pode usar para adicionar novos modelos e obter referências a modelos existentes.

from snowflake.ml.registry import Registry

reg = Registry(session=sp_session, database_name="ML", schema_name="REGISTRY")

Copy

Registro de modelos e versões¶

Adicionar um modelo ao registro é chamado de registro em log do modelo. Registre em log um modelo chamando o método log_model do registro. Este método serializa o modelo – um objeto Python – e cria um objeto modelo Snowflake a partir dele. Este método também adiciona metadados, como uma descrição, ao modelo, conforme especificado na chamada log_model.

Cada modelo pode ter versões ilimitadas. Para registrar versões adicionais do modelo em log, chame log_model novamente com o mesmo model_name, mas com um version_name diferente.

Você não pode adicionar tags a um modelo quando ele é adicionado ao registro, porque tags são atributos do modelo e log_model adiciona uma versão específica do modelo, criando um modelo apenas quando adiciona sua primeira versão. Você pode atualizar as tags do modelo depois de registrar a primeira versão do modelo em log.

No exemplo a seguir, clf, abreviação de “classificador”, é o objeto do modelo Python, que já foi criado em outro lugar em seu código. Você pode adicionar um comentário no momento do registro, conforme mostrado aqui. A combinação de nome e versão deve ser exclusiva no esquema. Você pode especificar listas de conda_dependencies; os pacotes especificados serão implantados com o modelo.

from snowflake.ml.model import task, type_hints
mv = reg.log_model(clf,
                   model_name="my_model",
                   version_name="v1",
                   conda_dependencies=["scikit-learn"],
                   comment="My awesome ML model",
                   metrics={"score": 96},
                   sample_input_data=train_features,
                   task=task.Task.TABULAR_BINARY_CLASSIFICATION)

Copy

Os argumentos de log_model são descritos aqui.

Argumentos exigidos

Argumento	Descrição
`model`	O objeto de modelo Python de um tipo de modelo compatível. Deve ser serializável (“selecionável”).
`model_name`	O nome do modelo, usado com `version_name` para identificar o modelo no registro. O nome não pode ser alterado depois que o modelo for registrado. Deve ser um identificador Snowflake válido.

Nota

A combinação do nome do modelo e da versão deve ser exclusiva no esquema.

Argumentos opcionais

Argumento	Descrição
`version_name`	Cadeia de caracteres especificando a versão do modelo, usada com `model_name` para identificar o modelo no registro. Deve ser um identificador Snowflake válido. Se ausente, um nome de versão legível por humanos será gerado automaticamente.
`code_paths`	Lista de caminhos para diretórios de código a serem importados ao carregar ou implantar o modelo.
`comment`	Comentário, por exemplo, uma descrição do modelo.
`conda_dependencies`	Lista de pacotes Conda exigidos pelo seu modelo. Este argumento especifica nomes de pacotes e versões opcionais em formato Conda, ou seja, `"[channel::]package [operator version]"`. Se você não especificar um canal, o canal do Snowflake será assumido quando o modelo for executado em um warehouse. O conda-forge será assumido para modelos executados no Snowpark Container Services (SPCS).
`ext_modules`	Lista de módulos externos para combinar com o modelo. Compatível com scikit-learn, Snowpark ML, PyTorch, TorchScript e modelos personalizados.
`metrics`	Dicionário com métricas vinculadas à versão do modelo.
`options`	Dicionário com opções para criação de modelo. As seguintes opções estão disponíveis para todos os tipos de modelo: `embed_local_ml_library`: se uma cópia da biblioteca local do Snowpark ML deve ser incorporada ao modelo. Padrão: `False`. `relax_version`: se deve relaxar as restrições de versão das dependências. Isso substitui os especificadores de versão como `==x.y.z` por especificadores como `<=x.y, <(x+1)`. Padrão: `True`. `save_location`: Uma cadeia de caracteres especificando o local (caminho de diretório) para salvar o modelo e metadados (por exemplo `"/path/to/my/directory"`). `function_type`: Define o tipo de função do método globalmente como “FUNCTION“ ou “TABLE_FUNCTION“. Para definir os tipos de função de método individualmente, consulte `function_type` em `model_options`. `method_options`: Um dicionário de opções por método, onde a chave é o nome de um método e o valor é um dicionário com uma ou mais das opções descritas aqui. As opções disponíveis são: `case_sensitive`: indica se o método e sua assinatura diferenciam maiúsculas de minúsculas. Os métodos que diferenciam maiúsculas de minúsculas devem ser colocados entre aspas duplas quando usados em SQL. Esta opção também permite caracteres não alfabéticos em nomes de métodos. Padrão: `False`. `max_batch_size`: tamanho máximo do lote que o método aceitará quando chamado no warehouse. Padrão: `None` (o tamanho do lote é determinado automaticamente). `function_type`: definir o tipo de função do método como “FUNCTION“ ou “TABLE_FUNCTION“. options = { "embed_local_ml_library": True, "relax_version": True, "save_location": "/path/to/my/directory", "function_type": "TABLE_FUNCTION", "method_options": { "predict": { "case_sensitive": False, "max_batch_size": 100, "function_type": "TABLE_FUNCTION", }, } Copy Tipos de modelos individuais podem oferecer suporte a opções adicionais. Consulte Uso de tipos de modelos incorporados.
`pip_requirements`	Lista de especificações de pacote para os pacotes PyPI exigidos pelo seu modelo. Os modelos em execução em um warehouse também devem especificar um repositório de artefatos pip (consulte o argumento `artifact_repository_map`, próximo).
`artifact_repository_map`	Dicionário mapeando o tipo de repositório de artefatos (deve ser `"pip"`) para um nome de repositório. Por exemplo, para usar o repositório de artefatos interno do PyPI, especifique `{"pip": "snowflake.snowpark.pypi_shared_repository"}`. Quando especificado, os requisitos do pip são instalados por meio do repositório de artefatos em ambientes de warehouse. O modelo a seguir pode ser executado no warehouse; o scikit-learn é instalado através do repositório de artefatos interno do `pypi_shared_repository`. mv = reg.log_model( clf, model_name="my_model", artifact_repository_map={ "pip": "snowflake.snowpark.pypi_shared_repository" }, pip_requirements=['scikit-learn'], sample_input_data=train_features, ) Copy
`resource_constraint`	Mapeamento de dicionário de chaves e valores de restrição de recursos do warehouse, por exemplo, {«architecture»: «x86»}. Isso pode ser usado para garantir que o modelo seja executado em um warehouse com a arquitetura necessária.
`target_platforms`	Lista de plataformas de destino para executar o modelo. As únicas entradas aceitáveis são uma combinação de `"WAREHOUSE"` e `"SNOWPARK_CONTAINER_SERVICES"`, ou uma constante da plataforma de destino. Se `WAREHOUSE` é especificado em `target_platforms`, e o modelo não pode ser executado no warehouse (devido a dependências, requisitos da GPU, tamanho do modelo, etc.), `log_model()` falha. O valor padrão no Container Runtime é `["SNOWPARK_CONTAINER_SERVICES"]` e ambos em outros lugares. Para modelos particionados, o valor deve ser `["WAREHOUSE"]` ou `snowflake.ml.model.target_platform.WAREHOUSE_ONLY`.
`python_version`	A versão do Python na qual o modelo será executado. O padrão é `None`, que designa a versão mais recente disponível no warehouse.
`sample_input_data`	Um DataFrame com os dados de entrada de amostra. Os nomes dos recurso exigidos pelo modelo e seus tipos são extraídos deste DataFrame. Este argumento ou `signatures` devem ser fornecidos para todos os modelos, exceto os modelos Snowpark ML e MLFlow e pipelines Hugging Face.
`signatures`	Modele assinaturas de métodos como um mapeamento do nome do método de destino para assinaturas de entrada e saída. Este argumento ou `sample_input_data` devem ser fornecidos para todos os modelos, exceto os modelos Snowpark ML e MLFlow e pipelines Hugging Face.
`task`	A tarefa que define o problema que o modelo deve resolver. Se não for especificado, o Snowflake se esforça ao máximo para inferir a tarefa do modelo a partir da classe do modelo. Se a classe do modelo não puder ser inferida, a tarefa do modelo será definida como `type_hints.Task.UNKNOWN`. Você deve definir esse parâmetro para usar a Observabilidade de ML. Isso nos ajuda a identificar quais métricas de monitoramento são relevantes para o seu modelo. Valores válidos: `snowflake.ml.model.task.Task.TABULAR_BINARY_CLASSIFICATION` `snowflake.ml.model.task.Task.TABULAR_REGRESSION` `snowflake.ml.model.task.Task.TABULAR_MULTI_CLASSIFICATION`
`user_files`	Um dicionário que mapeia o caminho do subdiretório do estágio para uma lista de caminhos de arquivos locais. Os caminhos de arquivo podem usar os curingas `?` e `*`. Por exemplo, `{"subdir": ["/path/to/my_file.json"]}` carregará `my_file.json` juntamente com os arquivos de modelo no subdiretório de estágio `subdir`. Para as versões do snowflake-ml-python >=1.7.3 e <1.8.1, o usuário deve definir o seguinte sinalizador para que os arquivos de usuário sejam incluídos: from snowflake.ml.model._model_composer.model_manifest import ( model_manifest ) model_manifest.ModelManifest._ENABLE_USER_FILES = True Copy

log_model retorna um objeto snowflake.ml.model.ModelVersion, que representa a versão do modelo que foi adicionado ao registro.

Após o registro, o modelo em si não pode ser modificado (embora você possa alterar seus metadados). Para excluir um modelo e todas as suas versões, use o método excluir_modelo do registro.

Trabalhar com dependências e plataformas de destino¶

target_platforms	Tipos de modelos	Comportamento padrão de `log_model()`	Outras opções
`[“SNOWPARK_CONTAINER_SERVICES”]` `snowflake.ml.model.target_platform.SNOWPARK_CONTAINER_SERVICES_ONLY` (padrão no Container Runtime)	Tipo de modelo incorporado	`pip_requirements` são preenchidos automaticamente. As versões dos pacotes são obtidas automaticamente do ambiente. O modelo não poderá ser executado em `WAREHOUSE`.	Os usuários podem substituir as dependências especificando `conda_dependencies` e/ou `pip_requirements`.
	Modelo personalizado	O modelo não poderá ser executado em `WAREHOUSE`. Os usuários devem fornecer todas as dependências em `conda_dependencies` e `pip_requirements`.
`[“WAREHOUSE”]` `snowflake.ml.model.target_platform.WAREHOUSE_ONLY` (modelos particionados)	Tipo de modelo incorporado	`conda_dependencies` são preenchidos automaticamente. As versões dos pacotes são obtidas automaticamente do ambiente. Se o modelo não for executável em `WAREHOUSE`, `log_model()` falhará.	Os usuários podem substituir as dependências especificando `conda_dependencies` e/ou `pip_requirements`. Para usar um repositório PyPI no warehouse, use o repositório de artefatos (atualmente um recurso em versão preliminar). Consulte `artifact_repository_map` abaixo.
	Modelo personalizado	Se o modelo não for executável em `WAREHOUSE`, `log_model()` falhará. Os usuários devem fornecer todas as dependências em `conda_dependencies` e/ou `pip_requirements`.	Para usar um repositório PyPI no warehouse, use o repositório de artefatos (atualmente um recurso em versão preliminar). Consulte `artifact_repository_map` abaixo.
`[“WAREHOUSE”, “SNOWPARK_CONTAINER_SERVICES”]` `snowflake.ml.model.target_platform.BOTH_WAREHOUSE_AND_SNOWPARK_CONTAINER_SERVICES` (padrão em todos os lugares, exceto no Container Runtime)	Tipo de modelo incorporado	`conda_dependencies` são preenchidos automaticamente. As versões dos pacotes são obtidas automaticamente do ambiente. Se o modelo não for executável em `WAREHOUSE`, `log_model()` falhará.	Os usuários podem substituir as dependências especificando `conda_dependencies` e/ou `pip_requirements`. Para usar um repositório PyPI no warehouse, use o repositório de artefatos (atualmente um recurso em versão preliminar). Consulte `artifact_repository_map` abaixo.
	Modelo personalizado	Se o modelo não for executável em `WAREHOUSE`, `log_model()` falhará. Os usuários devem fornecer todas as dependências em `conda_dependencies` e/ou `pip_requirements`.	Para usar um repositório PyPI no warehouse, use o repositório de artefatos (atualmente um recurso em versão preliminar). Consulte `artifact_repository_map` abaixo.

Como trabalhar com artefatos de modelo¶

Depois que um modelo é registrado, seus artefatos (os arquivos que dão suporte ao modelo, incluindo seus objetos Python serializados e vários arquivos de metadados, como seu manifesto) ficam disponíveis em um estágio interno. Os artefatos não podem ser modificados, mas você pode visualizar ou baixar os artefatos dos modelos que possui.

Nota

Ter o privilégio USAGE em um modelo não permite que você acesse seus artefatos; a propriedade é necessária.

Você pode acessar artefatos do modelo de um estágio usando, por exemplo, o comando GET ou seu equivalente em Snowpark Python, FileOperation.get.

No entanto, você não pode abordar artefatos de modelo usando a sintaxe usual do caminho de estágio. Em vez disso, use um snow:// URL, uma maneira mais geral de especificar a localização de objetos no Snowflake. Por exemplo, uma versão dentro de um modelo pode ser especificada por um URL do formulário snow://model/<model_name>/versions/<version_name>/.

Sabendo o nome do modelo e a versão que você deseja, você pode usar o comando LIST para visualizar os artefatos do modelo da seguinte forma:

LIST 'snow://model/my_model/versions/V3/';

Copy

A saída é semelhante a:

name                                      size                  md5                      last_modified
versions/V3/MANIFEST.yml           30639    2f6186fb8f7d06e737a4dfcdab8b1350        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/functions/apply.py      2249    e9df6db11894026ee137589a9b92c95d        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/functions/predict.py    2251    132699b4be39cc0863c6575b18127f26        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/model.zip             721663    e92814d653cecf576f97befd6836a3c6        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/model/env/conda.yml          332        1574be90b7673a8439711471d58ec746        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/model/model.yaml       25718    33e3d9007f749bb2e98f19af2a57a80b        Thu, 18 Jan 2024 09:24:37 GMT

Para recuperar um desses artefatos, use o comando SQL GET.

GET 'snow://model/model_my_model/versions/V3/MANIFEST.yml' file::///tmp/my_model/

Copy

Ou o equivalente com Snowpark Python:

session.file.get('snow://model/my_model/versions/V3/MANIFEST.yml', 'model_artifacts')

Copy

Nota

Os nomes e a organização dos artefatos de um modelo podem variar dependendo do tipo do modelo e podem mudar. A lista de artefatos do exemplo anterior tem a intenção de ser ilustrativa, não autoritativa.

Exclusão de modelos¶

Use o método delete_model do registro para excluir um modelo e todas as suas versões.

reg.delete_model("mymodel")

Copy

Dica

Você também pode excluir modelos em SQL usando DROP MODEL.

Como obter modelos do registro¶

Para obter informações sobre cada modelo, use o método show_models:

model_df = reg.show_models()

Copy

Dica

Em SQL, use SHOW MODELS para obter uma lista de modelos.

O resultado de show_models é um pandas DataFrame. As colunas disponíveis estão listadas aqui:

Coluna	Descrição
`created_on`	Data e hora em que o modelo foi criado.
`name`	Nome do modelo.
`database_name`	Banco de dados no qual o modelo é armazenado.
`schema_name`	Esquema no qual o modelo é armazenado.
`owner`	Função proprietária do modelo.
`comment`	Comentário para o modelo.
`versions`	Matriz JSON listando versões do modelo.
`default_version_name`	Versão do modelo utilizado quando se refere ao modelo sem versão.

Para obter uma lista dos modelos no registro, cada um como uma instância Model, use o método models:

model_list = reg.models()

Copy

Para obter uma referência a um modelo específico do registro por nome, use o método get_model do registro.

m = reg.get_model("MyModel")

Copy

Nota

As instâncias de Model não são cópias do objeto de modelo Python original registrado; elas são referências ao objeto de modelo subjacente no registro.

Após ter uma referência para um modelo, seja um da lista retornada pelo método models ou uma recuperada usando get_model, é possível trabalhar com seus metadados e suas versões.

Exibição e atualização dos metadados de um modelo¶

Você pode visualizar e atualizar os atributos de metadados de um modelo no registro, incluindo seu nome, comentário, tags e métricas.

Recuperação e atualização de comentários¶

Use o atributo comment do modelo para recuperar e atualizar o comentário do modelo:

print(m.comment)
m.comment = "A better description than the one I provided originally"

Copy

Nota

O atributo description é um sinônimo de comment. O código anterior também pode ser escrito desta forma:

print(m.description)
m.description = "A better description than the one I provided originally"

Copy

Dica

Você também pode definir o comentário de um modelo em SQL usando ALTER MODEL.

Recuperação e atualização de tags¶

Tags são metadados usados para registrar a finalidade de um modelo, algoritmo, conjunto de dados de treinamento, estágio do ciclo de vida ou outras informações que você escolher. Você pode definir tags quando o modelo for registrado ou a qualquer momento posteriormente. Você também pode atualizar os valores das tags existentes ou remover totalmente as tags.

Nota

É necessário definir os nomes de todas as tags (e potencialmente seus possíveis valores) usando primeiro CREATE TAG. Consulte Introdução à marcação de objetos.

Para obter todas as tags de um modelo como um dicionário Python, use show_tags:

print(m.show_tags())

Copy

Para adicionar uma nova tag ou alterar o valor de uma tag existente, use set_tag:

m.set_tag("live_version", "v1")

Copy

Para recuperar o valor de uma tag, use get_tag:

m.get_tag("live_version")

Copy

Para remover uma tag, use unset_tag:

m.unset_tag("live_version")

Copy

Dica

Você também pode definir o comentário de um modelo em SQL usando ALTER MODEL.

Renomeação de um modelo¶

Use o método rename para renomear ou mover um modelo. Especifique um nome totalmente qualificado como o novo nome para mover o modelo para um banco de dados ou esquema diferente.

m.rename("MY_MODEL_TOO")

Copy

Dica

Você também pode renomear um modelo em SQL usando ALTER MODEL.

Como trabalhar com versões de modelo¶

Um modelo pode ter versões ilimitadas, cada uma identificada por uma cadeia de caracteres. Você pode usar qualquer convenção de nomenclatura de versão que desejar. Registrar um modelo na verdade registra uma versão específica do modelo. Para registrar versões adicionais de um modelo, chame log_model novamente com o mesmo model_name, mas com um version_name diferente.

Dica

Em SQL, use SHOW VERSIONS IN MODEL para ver as versões de um modelo.

Uma versão de um modelo é representada por uma instância da classe snowflake.ml.model.ModelVersion.

Para obter uma lista de todas as versões de um modelo, chame o método versions do objeto modelo. O resultado é uma lista de instâncias ModelVersion:

version_list = m.versions()

Copy

Para obter informações sobre cada modelo como um DataFrame, chame o método show_versions do modelo.

version_df = m.show_versions()

Copy

O DataFrame resultante contém as colunas a segui:

Coluna	Descrição
`created_on`	Data e hora em que a versão do modelo foi criada.
`name`	Nome da versão.
`database_name`	Banco de dados no qual a versão está armazenada.
`schema_name`	Esquema no qual a versão está armazenada.
`model_name`	Nome do modelo ao qual esta versão pertence.
`is_default_version`	Valor booliano que indica se esta versão é a versão padrão do modelo.
`functions`	Matriz JSON dos nomes das funções disponíveis nesta versão.
`metadata`	Objeto JSON contendo metadados como pares chave-valor (`{}` se nenhum metadado for especificado).
`user_data`	Objeto JSON da seção `user_data` do manifesto de definição do modelo (`{}` se nenhum dado do usuário for especificado).

Exclusão das versões do modelo¶

É possível excluir uma versão do modelo usando o método do modelo delete_version:

m.delete_version("rc1")

Copy

Dica

Também é possível excluir uma versão do modelo em SQL usando ALTER MODEL … DROP VERSION.

Versão padrão¶

Uma versão de um modelo pode ser designada como modelo padrão. Recupere ou defina o atributo default do modelo para obter a versão padrão atual (como um objeto ModelVersion) ou para alterá-la (usando uma cadeia de caracteres):

default_version = m.default
m.default = "v2"

Copy

Dica

Em SQL, use ALTER MODEL para definir a versão padrão.

Aliases da versão de modelo¶

É possível atribuir um alias a uma versão do modelo usando o comando SQL ALTER MODEL. Você pode usar um alias sempre que um nome de versão for necessário, como ao obter uma referência a uma versão de modelo, em Python ou em SQL. Um determinado alias pode ser atribuído a apenas uma versão de modelo por vez.

Além dos aliases que você cria, os seguintes aliases de sistema estão disponíveis em todos os modelos:

DEFAULT refere-se à versão padrão do modelo.
FIRST refere-se à versão mais antiga do modelo em termos de tempo de criação.
LAST refere-se à versão mais recente do modelo no momento da criação.

Os nomes de alias que você criar não devem ser iguais a nenhum nome de versão ou alias existente no modelo, incluindo aliases do sistema.

Como obter uma referência para uma versão do modelo¶

Para obter uma referência a uma versão específica de um modelo como uma instância ModelVersion, use o método version do modelo. Use o atributo default do modelo para obter a versão padrão do modelo:

m = reg.get_model("MyModel")

mv = m.version("v1")
mv = m.default

Copy

Após ter uma referência a uma versão específica de um modelo (como a variável mv neste exemplo), é possível recuperar ou atualizar seus comentários ou métricas e chamar os métodos (ou funções) do modelo, conforme mostrado nas seções a seguir.

Recuperação e atualização de comentários¶

Assim como acontece com os modelos, as versões do modelo podem ter comentários, que podem ser acessados e definidos por meio do atributo comment ou description da versão do modelo.

print(mv.comment)
print(mv.description)

mv.comment = "A model version comment"
mv.description = "Same as setting the comment"

Copy

Dica

Também é possível alterar o comentário de uma versão do modelo em SQL usando ALTER MODEL … MODIFY VERSION.

Recuperação e atualização de métricas¶

Métricas são pares chave-valor usados para rastrear a precisão da previsão e outras características da versão do modelo. Você pode definir métricas ao criar uma versão do modelo ou defini-las usando o método set_metric. Um valor de métrica pode ser qualquer objeto Python que possa ser serializado para JSON, incluindo números, cadeias de caracteres, listas e dicionários. Ao contrário das tags, os nomes das métricas e os valores possíveis não precisam ser definidos antecipadamente.

Uma métrica de precisão de teste pode ser gerada usando accuracy_score do sklearn:

from sklearn import metrics

test_accuracy = metrics.accuracy_score(test_labels, prediction)

Copy

A matriz de confusão pode ser gerada de forma semelhante usando o sklearn:

test_confusion_matrix = metrics.confusion_matrix(test_labels, prediction)

Copy

Então é possível definir esses valores como métricas:

# scalar metric
mv.set_metric("test_accuracy", test_accuracy)

# hierarchical (dictionary) metric
mv.set_metric("evaluation_info", {"dataset_used": "my_dataset", "accuracy": test_accuracy, "f1_score": f1_score})

# multivalent (matrix) metric
mv.set_metric("confusion_matrix", test_confusion_matrix)

Copy

Para recuperar as métricas de uma versão do modelo como um dicionário Python, use show_metrics:

metrics = mv.show_metrics()

Copy

Para excluir uma métrica, chame delete_metric:

mv.delete_metric("test_accuracy")

Copy

Dica

Você também pode modificar as métricas de uma versão do modelo (que são armazenadas como metadados) no SQL usando ALTER MODEL … MODIFY VERSION.

Recuperação de explicações do modelo¶

O registro do modelo é capaz de explicar os resultados de um modelo, informando quais recursos de entrada contribuem mais para as previsões, calculando os valores de Shapley. Este recurso de versão está disponível por padrão em todas as exibições de modelo criadas no Snowflake 8.31 e posteriores por meio do método explain do modelo subjacente. É possível chamar explain de SQL ou por meio de um método run de exibição de modelo em Python.

Para obter detalhes sobre esse recurso, consulte Explicabilidade do modelo.

Exportação de uma versão do modelo¶

Use mv.export para exportar os arquivos de um modelo para um diretório local; o diretório é criado se não existir:

mv.export("~/mymodel/")

Copy

Por padrão, os arquivos exportados incluem o código, o ambiente para carregar o modelo e os pesos do modelo. Para exportar também os arquivos necessários para executar o modelo em um warehouse, especifique export_mode = ExportMode.FULL:

mv.export("~/mymodel/", export_mode=ExportMode.FULL)

Copy

Carregamento da versão do modelo¶

Use mv.load para carregar o objeto do modelo Python original que foi adicionado originalmente ao registro. É possível então usar o modelo para inferência como se o tivesse definido em seu código Python:

clf = mv.load()

Copy

Para garantir a funcionalidade adequada de um modelo carregado do registro, o ambiente Python de destino (ou seja, as versões do interpretador Python e de todas as bibliotecas) deve ser idêntico ao ambiente do qual o modelo foi registrado. Especifique force=True na chamada load para forçar o carregamento do modelo mesmo que o ambiente seja diferente.

Dica

Para garantir que seu ambiente seja o mesmo onde o modelo está hospedado, baixe uma cópia do ambiente conda do registro do modelo:

conda_env = session.file.get("snow://model/<modelName>/versions/<versionName>/runtimes/python_runtime/env/conda.yml", ".")
open("~/conda.yml", "w").write(conda_env)

Copy

Em seguida, crie um novo ambiente conda a partir deste arquivo:

conda env create --name newenv --file=~/conda.yml
conda activate newenv

Copy

O argumento options opcional é um dicionário de opções para carregar o modelo. Atualmente, o argumento oferece suporte apenas à opção use_gpu.

Opção	Tipo	Descrição	Padrão
`use_gpu`	`bool`	Habilita a lógica de carregamento específica da GPU.	`False`

O exemplo a seguir ilustra o uso do argumento options:

clf = mv.load(options={"use_gpu": True})

Copy

Como chamar métodos de modelo¶

As versões do modelo podem ter métodos, que são funções anexadas que podem ser executadas para realizar inferência ou outras operações do modelo. As versões de um modelo podem ter métodos diferentes e as assinaturas desses métodos também podem ser diferentes.

Para chamar um método de uma versão de modelo, use mv.run, em que mv é um objeto ModelVersion. Especifique o nome da função a ser chamada e passe um Snowpark ou pandas DataFrame que contenha os dados de inferência, juntamente com os parâmetros necessários. O método é executado em um warehouse Snowflake.

O valor de retorno do método é um Snowpark ou pandas DataFrame, que corresponde ao tipo de DataFrame passado. DataFrames Snowpark são avaliados lentamente, então o método é executado somente quando o método do DataFrame collect, show ou to_pandas for chamado.

Nota

Invocar um método executa-o no warehouse especificado na sessão que você está usando para se conectar ao registro. Consulte Especificação de um warehouse.

O exemplo a seguir ilustra a execução do método predict de um modelo. O método predict deste modelo não requer nenhum parâmetro além dos dados de inferência (test_features aqui). Se assim fosse, eles seriam passados como argumentos adicionais após os dados de inferência.

remote_prediction = mv.run(test_features, function_name="predict")
remote_prediction.show()   # assuming test_features is Snowpark DataFrame

Copy

Para ver quais métodos podem ser chamados em um determinado modelo, chame mv.show_functions. O valor de retorno deste método é uma lista de objetos ModelFunctionInfo. Cada um desses objetos inclui os seguintes atributos:

name: o nome da função que pode ser chamada em Python ou SQL.
target_method: o nome do método Python no modelo registrado original.

Dica

Você também pode chamar métodos de modelo em SQL. Consulte Inferência a partir do SQL.

Considerações sobre custo¶

O uso do registro de modelo do Snowflake incorre em custos padrão baseados no consumo do Snowflake. Isso inclui:

Custo de armazenamento de artefatos, metadados e funções do modelo. Para obter informações gerais sobre os custos de armazenamento, consulte Exploração do custo de armazenamento.
Custo de cópia de arquivos entre estágios para o Snowflake. Consulte COPY FILES.
Custo de operações de objetos de modelo sem servidor por meio da interface Snowsight UI ou SQL ou Python, como mostra os modelos e versões de modelo e alteração de comentários, tags e métricas do modelo.
Custos de computação do warehouse, que variam de acordo com o tipo de modelo e a quantidade de dados usados na inferência. Para obter informações gerais sobre os custos de computação do Snowflake, consulte Explicação dos custos de computação. Os custos de computação do warehouse são incorridos para:
- Operações de criação de modelo e versão
- Invocação dos métodos de um modelo

Registro de modelo Snowflake¶

Privilégios obrigatórios¶

Limitações atuais¶

Abertura do registro de modelo do Snowflake¶

Registro de modelos e versões¶

Trabalhar com dependências e plataformas de destino¶

Como trabalhar com artefatos de modelo¶

Exclusão de modelos¶

Como obter modelos do registro¶

Exibição e atualização dos metadados de um modelo¶

Recuperação e atualização de comentários¶

Recuperação e atualização de tags¶

Renomeação de um modelo¶

Como trabalhar com versões de modelo¶

Exclusão das versões do modelo¶

Versão padrão¶

Aliases da versão de modelo¶

Como obter uma referência para uma versão do modelo¶

Recuperação e atualização de comentários¶

Recuperação e atualização de métricas¶

Recuperação de explicações do modelo¶

Exportação de uma versão do modelo¶

Carregamento da versão do modelo¶

Como chamar métodos de modelo¶

Compartilhamento de modelos¶

Considerações sobre custo¶