ML Snowpark¶

Le registre prend en charge les modèles créés à l’aide des APIs Snowpark ML modeling (modèles dérivés de snowpark.ml.modeling.framework.base.BaseEstimator).

Les options supplémentaires suivantes peuvent être utilisées dans le dictionnaire options lors de l’appel à log_model :


Option	Description
`target_methods`	Une liste des noms des méthodes disponibles sur l’objet modèle. Les modèles Snowpark ML ont les méthodes cibles suivantes par défaut, en supposant que la méthode existe : `predict`, `transform`, `predict_proba`, `predict_log_proba`, `decision_function`.

Il n’est pas nécessaire de spécifier sample_input_data ou signatures lors de l’enregistrement d’un modèle Snowpark ML ; ces éléments sont automatiquement déduits lors de l’ajustement.

Note

Les pipelines de Snowpark ML ont besoin d’un estimateur. Vous ne pouvez pas enregistrer un pipeline de transformateur uniquement pour Snowpark ML. Utilisez un pipeline scikit-learn pour enregistrer vos transformateurs.

Exemple¶

import pandas as pd
import numpy as np
from sklearn import datasets
from snowflake.ml.modeling.xgboost import XGBClassifier

iris = datasets.load_iris()
df = pd.DataFrame(data=np.c_[iris["data"], iris["target"]], columns=iris["feature_names"] + ["target"])
df.columns = [s.replace(" (CM)", "").replace(" ", "") for s in df.columns.str.upper()]

input_cols = ["SEPALLENGTH", "SEPALWIDTH", "PETALLENGTH", "PETALWIDTH"]
label_cols = "TARGET"
output_cols = "PREDICTED_TARGET"

clf_xgb = XGBClassifier(
        input_cols=input_cols, output_cols=output_cols, label_cols=label_cols, drop_input_cols=True
)
clf_xgb.fit(df)
model_ref = registry.log_model(
    clf_xgb,
    model_name="XGBClassifier",
    version_name="v1",
)
model_ref.run(df.drop(columns=label_cols).head(10), function_name='predict_proba')