scikit-learn¶
レジストリは、scikit-learnを使用して作成されたモデル(sklearn.base.BaseEstimator
または sklearn.pipeline.Pipeline
から派生したモデル)をサポートしています。
以下の追加オプションは、 options
ディクショナリで log_model
を呼び出すときに使用できます。
オプション |
説明 |
---|---|
|
モデルオブジェクトで利用可能なメソッド名。メソッドが存在すると仮定して、scikit-learnモデルはデフォルトで以下のターゲットメソッドを持ちます。 |
scikit-learnモデルをログする場合は、 sample_input_data
か signatures
のどちらかのパラメーターを指定する必要があります。
例¶
from sklearn import datasets, ensemble
iris_X, iris_y = datasets.load_iris(return_X_y=True, as_frame=True)
clf = ensemble.RandomForestClassifier(random_state=42)
clf.fit(iris_X, iris_y)
model_ref = registry.log_model(
clf,
model_name="RandomForestClassifier",
version_name="v1",
sample_input_data=iris_X,
options={
"method_options": {
"predict": {"case_sensitive": True},
"predict_proba": {"case_sensitive": True},
"predict_log_proba": {"case_sensitive": True},
}
},
)
model_ref.run(iris_X[-10:], function_name='"predict_proba"')
パイプライン:
from sklearn import datasets, ensemble, pipeline, preprocessing
iris_X, iris_y = datasets.load_iris(return_X_y=True, as_frame=True)
pipe = pipeline.Pipeline([
('scaler', preprocessing.StandardScaler()),
('classifier', ensemble.RandomForestClassifier(random_state=42)),
])
pipe.fit(iris_X, iris_y)
model_ref = registry.log_model(
pipe,
model_name="Pipeline",
version_name="v1",
sample_input_data=iris_X,
options={
"method_options": {
"predict": {"case_sensitive": True},
"predict_proba": {"case_sensitive": True},
"predict_log_proba": {"case_sensitive": True},
}
},
)
model_ref.run(iris_X[-10:], function_name='"predict_proba"')
注釈
scikit-learn パイプラインとして、scikit-learn の前処理と XGBoost モデルを組み合わせることができます。