Snowpark ML¶

레지스트리는 Snowpark ML 모델링 API (snowpark.ml.modeling.framework.base.BaseEstimator 에서 파생된 모델)를 사용하여 생성된 모델을 지원합니다.

log_model 을 호출할 때 options 사전에서 다음 추가 옵션을 사용할 수 있습니다.


옵션	설명
`target_methods`	모델 오브젝트에서 사용할 수 있는 메서드 이름 목록입니다. Snowpark ML 모델에는 대상 메서드가 존재한다고 가정하면 기본적으로 `predict`, `transform`, `predict_proba`, `predict_log_proba`, `decision_function` 메서드가 있습니다.

Snowpark ML 모델을 로깅할 때 sample_input_data 또는 signatures 를 지정할 필요가 없습니다. 이들은 피팅 중에 자동으로 추론됩니다.

참고

Snowpark ML 파이프라인에는 예측 도구가 필요합니다. 트랜스포머 전용 Snowpark ML 파이프라인은 등록할 수 없습니다. scikit-learn 파이프라인을 사용하여 트랜스포머를 등록하십시오.

예¶

import pandas as pd
import numpy as np
from sklearn import datasets
from snowflake.ml.modeling.xgboost import XGBClassifier

iris = datasets.load_iris()
df = pd.DataFrame(data=np.c_[iris["data"], iris["target"]], columns=iris["feature_names"] + ["target"])
df.columns = [s.replace(" (CM)", "").replace(" ", "") for s in df.columns.str.upper()]

input_cols = ["SEPALLENGTH", "SEPALWIDTH", "PETALLENGTH", "PETALWIDTH"]
label_cols = "TARGET"
output_cols = "PREDICTED_TARGET"

clf_xgb = XGBClassifier(
        input_cols=input_cols, output_cols=output_cols, label_cols=label_cols, drop_input_cols=True
)
clf_xgb.fit(df)
model_ref = registry.log_model(
    clf_xgb,
    model_name="XGBClassifier",
    version_name="v1",
)
model_ref.run(df.drop(columns=label_cols).head(10), function_name='predict_proba')