Transformateur de phrases¶
Le registre des modèles de Snowflake prend en charge les modèles qui utilisent des transformateurs de phrases (sentence_transformers.SentenceTransformer). Pour plus d’informations, voir la documentation relative aux transformateurs de phrases.
Pour que le registre connaisse les signatures des méthodes cibles, vous devez spécifier soit des échantillons de données d’entrée, soit les signatures qui définissent le schéma d’entrée et de sortie des méthodes du modèle.
Pour des échantillons de données d’entrée, spécifiez un Snowpark. DataFrame comme valeur pour le paramètre sample_input_data. Par exemple, vous pouvez spécifier une valeur telle que sample_input = pd.DataFrame(["This is a sample sentence."], columns=["TEXT"]).
Si vous utilisez le paramètre des signatures, indiquez un dictionnaire comme valeur pour le paramètre signatures. Le dictionnaire définit les méthodes d’entrée et de sortie du modèle. Par exemple, le code suivant définit le schéma d’entrée et de sortie pour la méthode encode du modèle :
Lorsque vous appelez log_model, vous pouvez utiliser les options supplémentaires suivantes dans le dictionnaire options :
Option |
Description |
|---|---|
|
Une liste des noms des méthodes disponibles sur l’objet modèle. Les modèles de transformateurs de phrases ont la méthode cible suivante par défaut, en supposant que la méthode existe : |
|
La version de l’environnement d’exécution CUDA à utiliser lors du déploiement sur une plateforme avec GPU ; la valeur par défaut est 11.8. S’il est défini manuellement sur |
L’exemple suivant :
Charge un modèle de transformateur de phrases pré-entraîné.
L’enregistre dans le registre des modèles ML de Snowflake.
Utilise le modèle enregistré pour l’inférence.
Note
Dans l’exemple, reg est une instance de snowflake.ml.registry.Registry. Pour plus d’informations sur la création d’un objet de registre, consultez Registre des modèles de Snowflake.