Snowflake Model Registry¶

참고

이 항목에 설명된 API 모델 레지스트리는 snowflake-ml-python 패키지 버전 1.5.0부터 일반적으로 제공됩니다.

모델을 학습시킨 후 모델을 작동하고 Snowflake에서 추론을 실행하려면 먼저 모델을 Snowflake Model Registry에 로깅해야 합니다. Model Registry를 사용하면 출처와 유형에 관계없이 Snowflake에서 모델과 해당 메타데이터를 안전하게 관리할 수 있으며 추론을 쉽게 실행할 수 있습니다.

중요

Snowflake Model Registry는 Snowflake ML 에코시스템용으로 Python에 개발된 머신 러닝 모델과 함께 작동합니다. Snowflake ML 함수)를 사용해 학습된 모델은 모델 레지스트리에 표시되지 않습니다. Cortex Fine-Tuned LLMs 같은 일부 모델 타입이 모델 레지스트리의 :doc:`Snowsight UI</developer-guide/snowflake-ml/model-registry/snowsight-ui>`에 표시되기는 하지만, 모델 레지스트리 API에서 관리되지는 않습니다.

Snowflake Model Registry는 다음과 같은 기능을 제공합니다.

모델 버전, 모델 메트릭, 모델 메타데이터를 저장하고 관리합니다.
Python, SQL 또는 REST API 엔드포인트를 사용하여 모델을 제공하고 대규모로 분산 추론을 실행합니다.
유연한 거버넌스 옵션을 통해 모델 라이프사이클을 관리하고 개발 환경에서 프로덕션 환경까지 모델 작업을 합니다.
Snowflake ML Observability를 사용하여 모델 성능과 드리프트를 모니터링합니다.
역할 기반 액세스 제어(RBAC)를 통해 모델 액세스를 안전하게 관리합니다.

Model Registry는 머신 러닝 모델을 일급 스키마 수준의 오브젝트로 Snowflake에 저장합니다.

모델을 로깅한 후에는 해당 모델의 메서드(함수나 저장 프로시저와 동일)를 호출하여 Snowflake 가상 웨어하우스 에서 추론 과 같은 모델 작업을 수행하거나 GPU 기반 추론 을 위해 Snowpark Container Services에서 모델을 제공할 수 있습니다.

The Snowflake Model Registry has built-in types support for the most common model types, including scikit-learn, xgboost, LightGBM, Prophet, CatBoost, PyTorch, TensorFlow, Keras, Sentence Transformers, Hugging Face pipelines, and MLFlow pyfunc models. The Model Registry is also flexible and powerful enough to support your own previously-trained models, as well as any custom processing code.

팁

예 및 빠른 시작 에서 엔드 투 엔드 워크플로와 관련된 이러한 모델 유형에 대한 예시 섹션을 참조하십시오.

Snowflake Model Registry Python API 의 주요 클래스는 다음과 같습니다.

snowflake.ml.registry.Registry: 스키마 내에서 모델을 관리합니다.
snowflake.ml.model.Model: 모델을 나타냅니다.
snowflake.ml.model.ModelVersion: 모델의 버전을 나타냅니다.

이 항목에서는 snowflake-ml-python 라이브러리를 사용하여 Python에서 레지스트리 작업을 수행하는 방법을 설명합니다. SQL에서도 많은 레지스트리 작업을 수행할 수 있으며, Model Registry SQL 섹션을 참조하십시오.

필수 권한¶

모델을 생성하려면 모델이 생성된 스키마를 소유하거나 모델에 대한 CREATE MODEL 권한이 있어야 합니다. 모델을 사용하려면 모델을 소유하거나 모델에 대한 USAGE 또는 READ 권한이 있어야 합니다.

USAGE 권한이 부여된 사용자는 모델 내부를 볼 수는 없지만, 웨어하우스 추론에 모델을 사용할 수는 있습니다.
READ 권한이 부여된 사용자는 SPCS 추론에 모델을 사용할 뿐만 아니라 설명, 태그, 메트릭 같은 메타데이터도 볼 수 있습니다.

스키마의 모든 기존 모델에 대한 USAGE 액세스 권한을 사용자에게 제공하려면 :code:`GRANT USAGE ON ALL MODELS IN SCHEMA <schema> TO ROLE <role>;`을 사용합니다. 또한 :code:`GRANT USAGE ON FUTURE MODELS IN SCHEMA <schema> TO ROLE <role>;`을 통해 스키마에서 자동으로 만들어지는 향후 모델에 대한 액세스 권한을 사용자에게 제공할 수 있습니다.

이와 마찬가지로, 사용자에게 동일한 구문을 사용하되 :code:`USAGE`를 :code:`READ`로 바꿔서 스키마의 기존 또는 향후 모든 모델에 READ 액세스 권한을 제공할 수 있습니다.

사용자의 역할에 모델 OWNER, USAGE 또는 READ 권한이 포함된 경우 Snowsight 모델 레지스트리 페이지<snowsight-ui>`에 표시됩니다. Snowflake에서 권한이 작동하는 방식에 대한 자세한 내용은 :doc:/user-guide/security-access-control-privileges` 섹션을 참조하십시오.

현재 제한 사항¶

다음 제한은 모델 및 모델 버전에 적용됩니다.

모델	최대 1000개 버전
모델 버전	최대 10개 메서드 메서드당 최대 500개의 인자 최대 메타데이터(메트릭 포함) 100KB 최대 총 모델 크기 15GB(웨어하우스 배포 모델의 경우) 최대 설정 파일 크기는 `conda.yml` 및 `log_model` 이 내부적으로 생성하는 기타 매니페스트 파일을 포함하여 250KB입니다. (예를 들어, 모델에 함수가 여러 개 있고 모든 함수가 많은 인자를 갖는 경우 이 제한을 초과할 수 있습니다.)

모델

최대 1000개 버전

모델 버전

최대 10개 메서드
메서드당 최대 500개의 인자
최대 메타데이터(메트릭 포함) 100KB
최대 총 모델 크기 15GB(웨어하우스 배포 모델의 경우)
최대 설정 파일 크기는 conda.yml 및 log_model 이 내부적으로 생성하는 기타 매니페스트 파일을 포함하여 250KB입니다. (예를 들어, 모델에 함수가 여러 개 있고 모든 함수가 많은 인자를 갖는 경우 이 제한을 초과할 수 있습니다.)

Snowflake Model Registry 열기¶

모델은 일급 Snowflake 오브젝트이며 다른 Snowflake 오브젝트와 함께 데이터베이스 및 스키마 내에서 구성할 수 있습니다. Snowflake Model Registry는 스키마 내에서 모델을 관리하기 위한 Python 클래스를 제공합니다. 따라서 모든 Snowflake 스키마를 레지스트리로 사용할 수 있습니다. 이 목적을 위해 스키마를 초기화하거나 준비할 필요는 없습니다. Snowflake에서는 이 목적을 위해 ML.REGISTRY와 같은 전용 스키마를 하나 이상 생성할 것을 권장합니다. CREATE SCHEMA 를 사용하여 스키마를 생성할 수 있습니다.

레지스트리에서 모델을 생성하거나 수정하려면 먼저 레지스트리를 열어야 합니다. 레지스트리를 열면 이에 대한 참조가 반환되며, 이를 사용하여 새 모델을 추가하고 기존 모델에 대한 참조를 얻을 수 있습니다.

from snowflake.ml.registry import Registry

reg = Registry(session=sp_session, database_name="ML", schema_name="REGISTRY")

Copy

모델 및 버전 등록하기¶

참고

외부 공급자의 모델을 Snowflake로 가져올 수도 있습니다. 자세한 내용은 외부 서비스에서 모델 가져오기 및 배포 섹션을 참조하십시오.

레지스트리에 모델을 추가하는 것을 모델 로깅 이라고 합니다. 레지스트리의 log_model 메서드를 호출하여 모델을 로깅합니다. 이 메서드는 모델(Python 객체)을 직렬화하고 이로부터 Snowflake 모델 오브젝트를 생성합니다. 이 메서드는 또한 log_model 호출에 지정된 대로 설명과 같은 메타데이터를 모델에 추가합니다.

각 모델은 무제한의 버전을 가질 수 있습니다. 모델의 추가 버전을 로깅하려면 동일한 model_name 및 다른 version_name 을 사용하여 log_model 을 다시 호출하십시오.

태그는 모델의 특성이므로 레지스트리에 모델을 추가할 때는 태그를 추가할 수 없으며, log_model 은 특정 모델 버전을 추가하고, 첫 번째 버전을 추가할 때만 모델을 생성합니다. 모델의 첫 번째 버전을 로깅한 후 모델 태그를 업데이트 할 수 있습니다.

다음 예제에서 clf 는 “분류기”의 줄임말이며, 코드의 다른 위치에서 이미 생성된 Python 모델 오브젝트입니다. 여기에 표시된 대로 등록할 때 설명을 추가할 수 있습니다. 이름과 버전의 조합은 스키마에서 고유해야 합니다. conda_dependencies 목록을 지정할 수 있으며, 지정된 패키지가 모델과 함께 배포됩니다.

from snowflake.ml.model import task, type_hints
mv = reg.log_model(clf,
                   model_name="my_model",
                   version_name="v1",
                   conda_dependencies=["scikit-learn"],
                   comment="My awesome ML model",
                   metrics={"score": 96},
                   sample_input_data=train_features,
                   task=task.Task.TABULAR_BINARY_CLASSIFICATION)

Copy

log_model 의 인자는 여기에 설명되어 있습니다.

필수 인자

인자	설명
`model`	지원되는 모델 유형의 Python 모델 오브젝트입니다. 직렬화 가능(“피클 가능”)해야 합니다.
`model_name`	레지스트리에서 모델을 식별하기 위해 `version_name` 과 함께 사용되는 모델 이름입니다. 모델이 로깅된 후에는 이름을 변경할 수 없습니다. 유효한 Snowflake 식별자 여야 합니다.

참고

모델 이름과 버전의 조합은 스키마에서 고유해야 합니다.

선택적 인자

인자	설명
`version_name`	모델 버전을 지정하는 문자열로, 레지스트리에서 모델을 식별하기 위해 `model_name` 과 함께 사용됩니다. 유효한 Snowflake 식별자 여야 합니다. 누락된 경우 사람이 읽을 수 있는 버전 이름이 자동으로 생성됩니다.
`code_paths`	모델을 로드하거나 배포할 때 가져올 코드의 디렉터리 경로 목록입니다.
`comment`	주석(예: 모델에 대한 설명)입니다.
`conda_dependencies`	모델에 필요한 Conda 패키지 목록입니다. 이 인자는 Conda 형식<https://docs.conda.io/projects/conda/en/latest/user-guide/concepts/pkg-search.html>`__(:code:”[channel::]package [operator version]”`)으로 패키지 이름과 선택적 버전을 지정합니다. 채널을 지정하지 않은 경우 모델이 웨어하우스에서 실행될 때 Snowflake 채널을 사용합니다. Snowpark Container Services(SPCS)에서 실행되는 모델의 경우 conda-forge를 사용합니다.
`ext_modules`	모델과 함께 피클링할 외부 모듈의 목록입니다. scikit-learn, Snowpark ML, PyTorch, TorchScript, 사용자 지정 모델에서 지원됩니다.
`metrics`	모델 버전에 연결된 메트릭이 포함된 사전입니다.
`options`	모델 생성 옵션이 포함된 사전입니다. 모든 모델 유형에 대해 다음 옵션을 사용할 수 있습니다. `embed_local_ml_library`: 로컬 Snowpark ML 라이브러리의 복사본을 모델에 포함할지 여부입니다. 기본값: `False`. `relax_version`: 종속성의 버전 제약 조건을 완화할지 여부입니다. 이는 `==x.y.z` 와 같은 버전 지정자를 `<=x.y, <(x+1)` 과 같은 지정자로 바꿉니다. 기본값: `True`. `save_location`: 모델과 메타데이터를 저장할 위치(디렉터리 경로)를 지정하는 문자열(예: `"/path/to/my/directory"`)입니다. `function_type`: Sets the method function type globally to either “FUNCTION” or “TABLE_FUNCTION”. To set method function types individually see `function_type` in `method_options`. `volatility`: 모든 모델 방법에 대해 휘발성을 설정합니다. 사용자 지정 모델의 기본값은 ``VOLATILE``이고 다른 모든 모델의 기본값은 ``IMMUTABLE``입니다. 메서드 휘발성을 개별적으로 설정하려면 :code:`method_options`의 :code:`volatility`를 참조하세요. 참고 `VOLATILE` 모델 메서드는 동적 테이블에서 사용할 때 전체 테이블을 새로 고쳐야 합니다. 자세한 내용은 동적 테이블에 대해 지원되는 쿼리 섹션을 참조하십시오. `method_options`: 메서드별 옵션 사전으로, 여기서 키는 메서드의 이름이고 값은 여기에 설명된 옵션 중 하나 이상이 포함된 사전입니다. 사용 가능한 옵션은 다음과 같습니다. `case_sensitive`: 메서드와 해당 서명이 대/소문자를 구분하는지 여부를 나타냅니다. 대/소문자를 구분하는 메서드는 SQL에서 사용 시 큰따옴표로 묶어야 합니다. 이 옵션은 메서드 이름에 알파벳이 아닌 문자도 허용합니다. 기본값: `False`. `max_batch_size`: 웨어하우스에서 호출 시 메서드가 허용하는 최대 배치 크기입니다. 기본값: `None` (배치 크기가 자동으로 결정됨) `function_type`: 메서드 함수 타입을 “FUNCTION” 또는 “TABLE_FUNCTION”으로 설정합니다. `volatility`: 결정적 함수의 경우 메서드 휘발성 수준을 ``IMMUTABLE``로 설정하고, 비결정적 함수의 경우 ``VOLATILE``로 설정합니다. 결정적 함수는 항상 동일한 입력에 대해 동일한 결과를 반환합니다. from snowflake.ml.model.volatility import Volatility options = { "embed_local_ml_library": True, "relax_version": True, "save_location": "/path/to/my/directory", "function_type": "TABLE_FUNCTION", "volatility": Volatility.IMMUTABLE, "method_options": { "predict": { "case_sensitive": False, "max_batch_size": 100, "function_type": "TABLE_FUNCTION", "volatility": Volatility.VOLATILE, }, } Copy 개별 모델 유형은 추가 옵션을 지원할 수 있습니다. 기본 제공 모델 유형 사용하기 섹션을 참조하십시오.
`pip_requirements`	모델에 필요한 PyPI 패키지의 패키지 사양 목록입니다. 웨어하우스에서 실행 중인 모델은 pip 아티팩트 리포지토리도 지정해야 합니다(다음의 `artifact_repository_map` 인자 참조).
`artifact_repository_map`	리포지토리 이름에 아티팩트 리포지토리 타입(:code:`”pip”`이어야 함)을 매핑하는 사전입니다. 예를 들어, 기본 제공 PyPI 아티팩트 리포지토리를 사용하려면 :code:`{“pip”: “snowflake.snowpark.pypi_shared_repository”}`를 지정하세요. 지정된 경우 pip 요구 사항이 웨어하우스 환경의 아티팩트 리포지토리를 통해 설치됩니다. 다음 모델은 웨어하우스에서 실행할 수 있습니다. scikit-learn은 기본 제공 `pypi_shared_repository` 아티팩트 리포지토리를 통해 설치됩니다. mv = reg.log_model( clf, model_name="my_model", artifact_repository_map={ "pip": "snowflake.snowpark.pypi_shared_repository" }, pip_requirements=['scikit-learn'], sample_input_data=train_features, ) Copy
`resource_constraint`	웨어하우스 리소스 제한 키/값(예: {“architecture”: “x86”})의 사전 매핑. 이를 통해 필요한 아키텍처가 있는 웨어하우스에서 모델이 실행되도록 할 수 있습니다.
`target_platforms`	모델을 실행할 대상 플랫폼 목록입니다. 유일하게 허용되는 입력이 "WAREHOUSE"`와 :code:”SNOWPARK_CONTAINER_SERVICES”` 또는 대상 플랫폼 상수의 조합입니다. WAREHOUSE`가 :code:`target_platforms`에 지정되어 있고 종속성, GPU 요구 사항, 모델 크기 등으로 인해 해당 웨어하우스에서 모델을 실행할 수 없는 경우, :code:`log_model()`에 실패합니다. :doc:`Container Runtime</developer-guide/snowflake-ml/container-runtime-ml>`의 기본값은 :code:`["SNOWPARK_CONTAINER_SERVICES"]`이고, 다른 경우 둘 다입니다. 분할된 모델의 값은 :code:`["WAREHOUSE"] 또는 :code:`snowflake.ml.model.target_platform.WAREHOUSE_ONLY`여야 합니다.
`python_version`	모델이 실행될 Python 버전입니다. 기본값은 웨어하우스에서 사용 가능한 최신 버전을 지정하는 `None` 입니다.
`sample_input_data`	샘플 입력 데이터가 포함된 DataFrame입니다. 모델에 필요한 특성 이름과 해당 유형이 이 DataFrame에서 추출됩니다. Snowpark ML 및 MLFlow 모델과 Hugging Face 파이프라인을 제외한 모든 모델에 이 인자 또는 `signatures` 를 제공해야 합니다.
`signatures`	대상 메서드 이름에서 입력 및 출력 서명으로의 매핑으로 사용되는 모델 메서드 서명입니다. Snowpark ML 및 MLFlow 모델과 Hugging Face 파이프라인을 제외한 모든 모델에 이 인자 또는 `sample_input_data` 를 제공해야 합니다.
`task`	모델이 해결하고자 하는 문제를 정의하는 작업입니다. 지정하지 않으면 Snowflake는 모델 클래스에서 모델 작업을 추론하기 위해 최선의 노력을 기울입니다. 모델 클래스를 유추할 수 없는 경우 모델 작업은 `type_hints.Task.UNKNOWN` 으로 설정됩니다. ML Observability 를 사용하려면 이 매개 변수를 설정해야 합니다. 이를 통해 어떤 모니터링 메트릭이 모델과 관련이 있는지 식별할 수 있습니다. 유효한 값: `snowflake.ml.model.task.Task.TABULAR_BINARY_CLASSIFICATION` `snowflake.ml.model.task.Task.TABULAR_REGRESSION` `snowflake.ml.model.task.Task.TABULAR_MULTI_CLASSIFICATION`
`user_files`	스테이지 하위 디렉터리 경로를 로컬 파일 경로 목록에 매핑하는 사전입니다. 파일 경로는 `?` 및 `*` 와일드카드를 사용할 수 있습니다. 예를 들어, `{"subdir": ["/path/to/my_file.json"]}` 은 모델 파일과 함께 `my_file.json` 을 `subdir` 스테이지 하위 디렉터리에 업로드합니다. snowflake-ml-python 버전이 1.7.3 이상부터 1.8.1 미만인 경우, 사용자는 사용자 파일을 포함하려면 다음 플래그를 설정해야 합니다. from snowflake.ml.model._model_composer.model_manifest import ( model_manifest ) model_manifest.ModelManifest._ENABLE_USER_FILES = True Copy

log_model 은 레지스트리에 추가된 모델의 버전을 나타내는 snowflake.ml.model.ModelVersion 오브젝트를 반환합니다.

등록된 후에는 모델 자체를 수정할 수 없습니다(단, 해당 메타데이터는 변경할 수 있음). 모델과 해당 버전을 모두 삭제하려면 레지스트리의 delete_model 메서드를 사용하십시오.

종속성 및 대상 플랫폼으로 작업하기¶

대상_플랫폼	모델 유형	`log_model()`의 기본 동작	기타 옵션
`[“SNOWPARK_CONTAINER_SERVICES”]` `snowflake.ml.model.target_platform.SNOWPARK_CONTAINER_SERVICES_ONLY` (Container Runtime의 기본값)	기본 제공 모델 유형	`pip_requirements` 가 자동으로 채워집니다. 패키지 버전은 환경에서 자동으로 선택됩니다. 이 모델은 `WAREHOUSE` 에서 실행할 수 없습니다.	사용자는 `conda_dependencies` 및/또는 `pip_requirements` 를 지정하여 종속성을 재정의할 수 있습니다.
	사용자 지정 모델	이 모델은 `WAREHOUSE` 에서 실행할 수 없습니다. 사용자는 `conda_dependencies` 및 `pip_requirements` 중 하나에서 모든 종속성을 제공해야 합니다.
`[“WAREHOUSE”]` `snowflake.ml.model.target_platform.WAREHOUSE_ONLY` (분할된 모델)	기본 제공 모델 유형	`conda_dependencies` 가 자동으로 채워집니다. 패키지 버전은 환경에서 자동으로 선택됩니다. `WAREHOUSE` 에서 모델을 실행할 수 없는 경우 `log_model()` 은 실패합니다.	사용자는 `conda_dependencies` 및/또는 `pip_requirements` 를 지정하여 종속성을 재정의할 수 있습니다. 웨어하우스에서 PyPI 리포지토리를 사용하려면 아티팩트 리포지토리(현재 미리 보기 기능)를 사용합니다. 아래 `artifact_repository_map` 섹션을 참조하세요.
	사용자 지정 모델	`WAREHOUSE` 에서 모델을 실행할 수 없는 경우 `log_model()` 은 실패합니다. 사용자는 `conda_dependencies` 및/또는 `pip_requirements` 에서 모든 종속성을 제공해야 합니다.	웨어하우스에서 PyPI 리포지토리를 사용하려면 아티팩트 리포지토리(현재 미리 보기 기능)를 사용합니다. 아래 `artifact_repository_map` 섹션을 참조하세요.
`[“WAREHOUSE”, “SNOWPARK_CONTAINER_SERVICES”]` `snowflake.ml.model.target_platform.BOTH_WAREHOUSE_AND_SNOWPARK_CONTAINER_SERVICES` (Container Runtime을 제외한 모든 곳에서 기본값)	기본 제공 모델 유형	`conda_dependencies` 가 자동으로 채워집니다. 패키지 버전은 환경에서 자동으로 선택됩니다. `WAREHOUSE` 에서 모델을 실행할 수 없는 경우 `log_model()` 은 실패합니다.	사용자는 `conda_dependencies` 및/또는 `pip_requirements` 를 지정하여 종속성을 재정의할 수 있습니다. 웨어하우스에서 PyPI 리포지토리를 사용하려면 아티팩트 리포지토리(현재 미리 보기 기능)를 사용합니다. 아래 `artifact_repository_map` 섹션을 참조하세요.
	사용자 지정 모델	`WAREHOUSE` 에서 모델을 실행할 수 없는 경우 `log_model()` 은 실패합니다. 사용자는 `conda_dependencies` 및/또는 `pip_requirements` 에서 모든 종속성을 제공해야 합니다.	웨어하우스에서 PyPI 리포지토리를 사용하려면 아티팩트 리포지토리(현재 미리 보기 기능)를 사용합니다. 아래 `artifact_repository_map` 섹션을 참조하세요.

모델 아티팩트 작업하기¶

모델이 로깅된 후에는 해당 아티팩트(직렬화된 Python 오브젝트 및 매니페스트와 같은 다양한 메타데이터 파일 등 모델을 지원하는 파일)를 내부 스테이지에서 사용할 수 있습니다. 아티팩트는 수정할 수 없지만, 소유한 모델의 아티팩트를 보거나 다운로드할 수는 있습니다.

참고

모델에 대한 USAGE 권한이 있어도 해당 아티팩트에 액세스할 수 없으며 소유권이 필요합니다.

스테이지에서 모델 아티팩트에 액세스하려면, 예를 들어 GET 명령 또는 이에 상응하는 Snowpark Python의 FileOperation.get 을 사용하면 됩니다.

하지만 일반적인 스테이지 경로 구문을 사용하여 모델 아티팩트를 처리할 수는 없습니다. 대신 보다 일반적인 방법인 snow:// URL을 사용하여 Snowflake에서 오브젝트의 위치를 지정합니다. 예를 들어, 모델 내부의 버전은 snow://model/<model_name>/versions/<version_name>/ 형식의 URL로 지정할 수 있습니다.

모델의 이름과 원하는 버전을 알면 LIST 명령어 를 사용하여 다음과 같이 모델의 아티팩트를 볼 수 있습니다.

LIST 'snow://model/my_model/versions/V3/';

Copy

출력은 다음과 같습니다.

name                                      size                  md5                      last_modified
versions/V3/MANIFEST.yml           30639    2f6186fb8f7d06e737a4dfcdab8b1350        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/functions/apply.py      2249    e9df6db11894026ee137589a9b92c95d        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/functions/predict.py    2251    132699b4be39cc0863c6575b18127f26        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/model.zip             721663    e92814d653cecf576f97befd6836a3c6        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/model/env/conda.yml          332        1574be90b7673a8439711471d58ec746        Thu, 18 Jan 2024 09:24:37 GMT
versions/V3/model/model.yaml       25718    33e3d9007f749bb2e98f19af2a57a80b        Thu, 18 Jan 2024 09:24:37 GMT

이러한 아티팩트 중 하나를 검색하려면 SQL GET 명령을 사용합니다.

GET 'snow://model/model_my_model/versions/V3/MANIFEST.yml' file::///tmp/my_model/

Copy

또는 Snowpark Python의 해당 명령을 사용합니다.

session.file.get('snow://model/my_model/versions/V3/MANIFEST.yml', 'model_artifacts')

Copy

참고

모델 아티팩트의 이름과 구성은 모델 유형에 따라 다를 수 있으며 변경될 수도 있습니다. 앞의 예제 아티팩트 목록은 예시를 위한 것이지 권위 있는 것이 아닙니다.

모델 삭제하기¶

모델과 해당 버전을 모두 삭제하려면 레지스트리의 delete_model 메서드를 사용하십시오.

reg.delete_model("mymodel")

Copy

팁

DROP MODEL 을 사용하여 SQL로 모델을 삭제할 수도 있습니다.

레지스트리에서 모델 가져오기¶

각 모델에 대한 정보를 얻으려면 show_models 메서드를 사용하십시오.

model_df = reg.show_models()

Copy

팁

SQL로, 모델 목록을 가져오려면 SHOW MODELS 를 사용합니다.

show_models 의 결과는 pandas DataFrame입니다. 사용 가능한 열은 다음과 같습니다.

열	설명
`created_on`	모델이 생성된 날짜 및 시간입니다.
`name`	모델의 이름입니다.
`database_name`	모델이 저장되는 데이터베이스입니다.
`schema_name`	모델이 저장되는 스키마입니다.
`owner`	모델을 소유한 역할입니다.
`comment`	모델에 대한 설명입니다.
`versions`	모델의 JSON 배열 목록 버전입니다.
`default_version_name`	버전이 없는 모델을 참조할 때 사용되는 모델의 버전입니다.

대신 레지스트리에서 모델 목록을 각각 Model 인스턴스로 가져오려면 models 메서드를 사용하십시오.

model_list = reg.models()

Copy

이름으로 레지스트리에서 특정 모델에 대한 참조를 가져오려면 레지스트리의 get_model 메서드를 사용하십시오.

m = reg.get_model("MyModel")

Copy

참고

Model 인스턴스는 로깅된 Python 모델 오브젝트 원본의 복사본이 아니라, 레지스트리의 기본 모델 오브젝트에 대한 참조입니다.

모델에 대한 참조(models 메서드에서 반환된 목록의 참조 또는 get_model 을 사용하여 검색된 참조)가 있으면 해당 메타데이터 및 해당 버전 으로 작업할 수 있습니다.

모델의 메타데이터 보기 및 업데이트하기¶

이름, 설명, 태그, 메트릭 등 레지스트리에서 모델의 메타데이터 특성을 보고 업데이트할 수 있습니다.

주석 검색 및 업데이트하기¶

모델의 설명을 검색하고 업데이트하려면 모델의 comment 특성을 사용합니다.

print(m.comment)
m.comment = "A better description than the one I provided originally"

Copy

참고

description 은 comment 의 동의어입니다. 이전 코드는 다음과 같이 작성할 수도 있습니다.

print(m.description)
m.description = "A better description than the one I provided originally"

Copy

팁

ALTER MODEL 를 사용하여 SQL로 모델의 설명을 설정할 수도 있습니다.

태그 검색 및 업데이트하기¶

태그는 모델의 목적, 알고리즘, 학습 데이터 세트, 수명 주기 스테이지 또는 선택하는 기타 정보를 기록하는 데 사용되는 메타데이터입니다. 모델이 등록될 때나 그 이후 언제든지 태그를 설정할 수 있습니다. 기존 태그의 값을 업데이트하거나 태그를 완전히 제거할 수도 있습니다.

참고

먼저 모든 태그의 이름(및 가능한 값)을 CREATE TAG를 사용하여 정의해야 합니다. 오브젝트 태그 소개 섹션을 참조하십시오.

모델의 모든 태그를 Python 사전으로 가져오려면 show_tags 를 사용하십시오.

print(m.show_tags())

Copy

새 태그를 추가하거나 기존 태그의 값을 변경하려면 set_tag 를 사용하십시오.

m.set_tag("live_version", "v1")

Copy

태그 값을 검색하려면 get_tag 를 사용하십시오.

m.get_tag("live_version")

Copy

태그를 제거하려면 unset_tag 를 사용하십시오.

m.unset_tag("live_version")

Copy

팁

ALTER MODEL 를 사용하여 SQL로 모델의 설명을 설정할 수도 있습니다.

모델 이름 바꾸기¶

모델 이름을 바꾸거나 모델을 이동하려면 rename 메서드를 사용합니다. 모델을 다른 데이터베이스나 스키마로 이동하려면 새 이름으로 정규화된 이름을 지정합니다.

m.rename("MY_MODEL_TOO")

Copy

팁

ALTER MODEL 을 사용하여 SQL로 모델의 이름을 변경할 수도 있습니다.

모델 버전 관련 작업하기¶

모델은 무제한의 버전을 가질 수 있으며, 각 버전은 문자열로 식별됩니다. 원하는 버전 명명 규칙을 사용할 수 있습니다. 모델을 로깅하면 실제로 모델의 특정 버전 이 기록됩니다. 모델의 추가 버전을 로깅하려면 동일한 model_name 및 다른 version_name 을 사용하여 log_model 을 다시 호출하십시오.

팁

SQL로, 모델의 버전을 확인하려면 SHOW VERSIONS IN MODEL 을 사용합니다.

모델 버전은 snowflake.ml.model.ModelVersion 클래스의 인스턴스로 표시됩니다.

모델의 모든 버전 목록을 가져오려면 모델 오브젝트의 versions 메서드를 호출하십시오. 결과는 ModelVersion 인스턴스의 목록입니다.

version_list = m.versions()

Copy

대신 각 모델에 대한 정보를 DataFrame으로 가져오려면 모델의 show_versions 메서드를 호출하십시오.

version_df = m.show_versions()

Copy

결과 DataFrame에는 다음 열이 포함됩니다.

열	설명
`created_on`	모델 버전이 생성된 날짜 및 시간입니다.
`name`	버전의 이름입니다.
`database_name`	버전이 저장되는 데이터베이스입니다.
`schema_name`	버전이 저장되는 스키마입니다.
`model_name`	이 버전이 속한 모델의 이름입니다.
`is_default_version`	이 버전이 모델의 기본 버전인지 여부를 나타내는 부울 값입니다.
`functions`	이 버전에서 사용할 수 있는 함수 이름의 JSON 배열입니다.
`metadata`	메타데이터를 키-값 페어로 포함하는 JSON 오브젝트입니다(메타데이터가 지정되지 않은 경우에는 `{}`).
`user_data`	모델 정의 매니페스트의 `user_data` 섹션에 있는 JSON 오브젝트입니다(사용자 데이터가 지정되지 않은 경우에는 `{}`).

모델 버전 삭제하기¶

모델의 delete_version 메서드를 사용하여 모델 버전을 삭제할 수 있습니다.

m.delete_version("rc1")

Copy

팁

ALTER MODEL … DROP VERSION 를 사용하여 SQL로 모델 버전을 삭제할 수도 있습니다.

기본 버전¶

모델의 버전이 기본 모델로 지정될 수 있습니다. 현재 기본 버전을 (ModelVersion 오브젝트로) 가져오거나 (문자열을 사용하여) 변경하려면 모델의 default 특성을 검색하거나 설정합니다.

default_version = m.default
m.default = "v2"

Copy

팁

SQL로 기본 버전을 설정하려면 ALTER MODEL 을 사용합니다.

모델 버전 별칭¶

모델 버전에 별칭을 지정하려면 SQL ALTER MODEL 명령을 사용하여 별칭을 지정할 수 있습니다. 모델 버전에 대한 참조를 가져올 때와 같이 버전 이름이 필요한 곳이면 어디에서나 Python 또는 SQL로 별칭을 사용할 수 있습니다. 1개의 별칭은 한 번에 1개의 모델 버전에만 할당될 수 있습니다.

사용자가 만든 별칭 외에도 모든 모델에서 다음과 같은 시스템 별칭을 사용할 수 있습니다.

DEFAULT 는 모델의 기본 버전을 나타냅니다.
FIRST 는 생성 시간을 기준으로 가장 오래된 버전의 모델을 나타냅니다.
LAST 는 생성 시점을 기준으로 최신 버전의 모델을 나타냅니다.

생성하는 별칭 이름은 시스템 별칭을 포함하여 모델의 기존 버전 이름이나 별칭과 동일하지 않아야 합니다.

모델 버전에 대한 참조 가져오기¶

특정 버전의 모델에 대한 참조를 ModelVersion 인스턴스로 가져오려면 모델의 version 메서드를 사용하십시오. 모델의 기본 버전을 가져오려면 모델의 default 특성을 사용합니다.

m = reg.get_model("MyModel")

mv = m.version("v1")
mv = m.default

Copy

모델의 특정 버전을 참조(예: 이 예제의 변수 mv)한 후 다음 섹션에 표시된 대로 참조의 설명이나 메트릭을 검색하거나 업데이트하고 모델의 메서드(또는 함수)를 호출할 수 있습니다.

주석 검색 및 업데이트하기¶

모델과 마찬가지로 모델 버전에도 설명이 있을 수 있으며, 설명은 모델 버전의 comment 또는 description 특성을 통해 액세스하고 설정할 수 있습니다.

print(mv.comment)
print(mv.description)

mv.comment = "A model version comment"
mv.description = "Same as setting the comment"

Copy

팁

ALTER MODEL … MODIFY VERSION 를 사용하여 SQL로 모델 버전의 설명을 설정할 수도 있습니다.

메트릭 검색 및 업데이트하기¶

메트릭은 예측 정확도 및 기타 모델 버전 특성을 추적하는 데 사용되는 키-값 페어입니다. 모델 버전을 생성할 때 메트릭을 설정하거나 set_metric 메서드를 사용하여 설정할 수 있습니다. 메트릭 값은 숫자, 문자열, 목록, 사전을 포함하여 JSON으로 직렬화할 수 있는 모든 Python 오브젝트일 수 있습니다. 태그와 달리, 메트릭 이름과 가능한 값을 미리 정의할 필요가 없습니다.

테스트 정확도 메트릭은 sklearn의 accuracy_score 를 사용하여 생성될 수 있습니다.

from sklearn import metrics

test_accuracy = metrics.accuracy_score(test_labels, prediction)

Copy

혼동 행렬은 sklearn을 사용하여 유사하게 생성할 수 있습니다.

test_confusion_matrix = metrics.confusion_matrix(test_labels, prediction)

Copy

그런 다음 이러한 값을 메트릭으로 설정할 수 있습니다.

# scalar metric
mv.set_metric("test_accuracy", test_accuracy)

# hierarchical (dictionary) metric
mv.set_metric("evaluation_info", {"dataset_used": "my_dataset", "accuracy": test_accuracy, "f1_score": f1_score})

# multivalent (matrix) metric
mv.set_metric("confusion_matrix", test_confusion_matrix)

Copy

모델 버전의 메트릭을 Python 사전으로 검색하려면 show_metrics 를 사용하십시오.

metrics = mv.show_metrics()

Copy

메트릭을 삭제하려면 delete_metric 을 호출하십시오.

mv.delete_metric("test_accuracy")

Copy

팁

또한 메타데이터로 저장된 모델 버전의 메트릭은 SQL에서 :doc:`/sql-reference/sql/alter-model-modify-version`을 사용하여 수정할 수 있습니다.

모델 설명 검색¶

모델 레지스트리는 모델 결과를 설명할 수 있으며, 어떤 입력 기능이 예측에 가장 많이 기여했는지 Shapley 값 을 계산하여 설명합니다. 이 미리 보기 기능은 Snowflake 8.31 이상에서 생성된 모든 모델 뷰에서 기본으로 기본 모델의 explain 메서드를 통해 사용할 수 있습니다. SQL에서 explain 을 호출하거나 Python에서 모델 뷰의 run 메서드를 통해 호출할 수 있습니다.

이 기능에 대한 자세한 내용은 Model Explainability 섹션을 참조하십시오.

모델 버전 내보내기¶

모델의 파일을 로컬 디렉터리로 내보내려면 mv.export 를 사용하며, 디렉터리가 없는 경우 디렉터리가 생성됩니다.

mv.export("~/mymodel/")

Copy

기본적으로 내보낸 파일에는 코드, 모델을 로드하는 환경, 모델 가중치가 포함됩니다. 웨어하우스에서 모델을 실행하는 데 필요한 파일을 내보내려면 export_mode = ExportMode.FULL 을 지정합니다.

mv.export("~/mymodel/", export_mode=ExportMode.FULL)

Copy

모델 버전 로드하기¶

원래 레지스트리에 추가한 원본 Python 모델 오브젝트를 로드하려면 mv.load 를 사용합니다. 그러면 Python 코드에서 정의한 것처럼 해당 모델을 추론에 사용할 수 있습니다.

clf = mv.load()

Copy

레지스트리에서 로드된 모델이 올바르게 동작하려면 대상 Python 환경(즉, Python 인터프리터 및 모든 라이브러리의 버전)이 모델이 로깅된 환경과 동일해야 합니다. 환경이 다른 경우에도 모델을 강제로 로드하려면 load 호출에 force=True 를 지정합니다.

팁

모델이 호스팅되는 환경과 사용자 환경이 동일한지 확인하려면 모델 레지스트리에서 conda 환경 사본을 다운로드합니다.

conda_env = session.file.get("snow://model/<modelName>/versions/<versionName>/runtimes/python_runtime/env/conda.yml", ".")
open("~/conda.yml", "w").write(conda_env)

Copy

그런 다음 이 파일에서 새 conda 환경을 생성합니다.

conda env create --name newenv --file=~/conda.yml
conda activate newenv

Copy

선택적 options 인자는 모델을 로드하기 위한 옵션 사전입니다. 현재 이 인자는 use_gpu 옵션만 지원합니다.

옵션	타입	설명	기본값
`use_gpu`	`bool`	GPU별 로딩 논리를 지원합니다.	`False`

다음 예제는 options 인자의 사용법을 설명합니다.

clf = mv.load(options={"use_gpu": True})

Copy

모델 메서드 호출하기¶

모델 버전에는 추론이나 기타 모델 작업을 수행하기 위해 실행할 수 있는 연결된 함수인 메서드 가 있을 수 있습니다. 모델 버전에는 다양한 메서드가 있을 수 있으며 이러한 메서드의 서명도 다를 수 있습니다.

모델 버전의 메서드를 호출하려면 mv.run 을 사용하며, 여기서 mv 는 ModelVersion 오브젝트입니다. 호출할 함수의 이름을 지정하고 필요한 매개 변수와 함께 추론 데이터가 포함된 Snowpark 또는 pandas DataFrame 을 전달합니다. 이 메서드는 Snowflake 웨어하우스에서 실행됩니다.

메서드의 반환값은 전달된 DataFrame 의 유형과 일치하는 Snowpark 또는 pandas DataFrame 입니다. Snowpark DataFrames는 지연 평가되므로 메서드는 DataFrame의 collect, show 또는 to_pandas 메서드가 호출될 때만 실행됩니다.

참고

메서드를 호출하면 레지스트리에 연결하는 데 사용하는 세션에 지정된 웨어하우스에서 해당 메서드가 실행됩니다. 웨어하우스 지정하기 섹션을 참조하십시오.

다음 예에서는 모델의 predict 메서드를 실행하는 방법을 보여줍니다. 이 모델의 predict 메서드에는 추론 데이터(여기서는 test_features) 외에 어떤 매개 변수도 필요하지 않습니다. 필요한 경우에는 추론 데이터 뒤에 추가 인자로 전달됩니다.

remote_prediction = mv.run(test_features, function_name="predict")
remote_prediction.show()   # assuming test_features is Snowpark DataFrame

Copy

특정 모델에서 호출할 수 있는 메서드를 확인하려면 mv.show_functions 를 호출하십시오. 이 메서드의 반환 값은 ModelFunctionInfo 오브젝트의 목록입니다. 이러한 각 오브젝트에는 다음 속성이 포함됩니다.

name: Python 또는 SQL에서 호출할 수 있는 함수의 이름입니다.
target_method: 원래 로깅된 모델의 Python 메서드 이름입니다.

팁

또한 모델 메서드를 SQL로 호출할 수도 있습니다. SQL 에서 추론 을 확인하십시오.

비용 고려 사항¶

Snowflake Model Registry를 사용하면 표준 Snowflake 소비 기반 비용이 발생합니다. 다음과 같은 오브젝트가 이에 해당합니다.

모델 아티팩트, 메타데이터, 함수를 저장하는 비용. 저장소 비용에 대한 일반적인 내용은 저장소 비용 살펴보기 섹션을 참조하십시오.
스테이지 간에 파일을 Snowflake에 복사하는 데 드는 비용. COPY FILES 섹션을 참조하십시오.
모델 및 모델 버전 표시, 모델 주석, 태그 및 메트릭 변경과 같은 Snowsight UI나 SQL 또는 Python 인터페이스를 통한 서버리스 모델 오브젝트 작업 비용.
모델 유형과 추론에 사용된 데이터의 양에 따라 달라지는 웨어하우스 컴퓨팅 비용. Snowflake 컴퓨팅 비용에 대한 일반적인 정보는 컴퓨팅 비용 이해하기 섹션을 참조하십시오. 다음에 대해 웨어하우스 컴퓨팅 비용이 발생합니다.
- 모델 및 버전 생성 작업
- 모델의 메서드 호출

Snowflake Model Registry¶

필수 권한¶

현재 제한 사항¶

Snowflake Model Registry 열기¶

모델 및 버전 등록하기¶

종속성 및 대상 플랫폼으로 작업하기¶

모델 아티팩트 작업하기¶

모델 삭제하기¶

레지스트리에서 모델 가져오기¶

모델의 메타데이터 보기 및 업데이트하기¶

주석 검색 및 업데이트하기¶

태그 검색 및 업데이트하기¶

모델 이름 바꾸기¶

모델 버전 관련 작업하기¶

모델 버전 삭제하기¶

기본 버전¶

모델 버전 별칭¶

모델 버전에 대한 참조 가져오기¶

주석 검색 및 업데이트하기¶

메트릭 검색 및 업데이트하기¶

모델 설명 검색¶

모델 버전 내보내기¶

모델 버전 로드하기¶

모델 메서드 호출하기¶

모델 공유하기¶

비용 고려 사항¶