Erzwingung von Plots

Verwenden Sie die plot_force()-Funktion, um eine Visualisierung zu erstellen, die zeigt, wie jedes Feature zur Vorhersage Ihres Modells beiträgt. Der Beitrag eines Features wird durch einen Pfeil dargestellt, der die Vorhersage des Modells vom Basiswert aus höher oder niedriger steuert.

Beispiel für einen erzwungenen Plot, der den Beitrag von Features zu einer Modellvorhersage zeigt

Die Größe des Pfeils im Plot entspricht der Größenordnung. In der vorherigen Abbildung hat feature_5 den größten positiven Einfluss (wodurch die Vorhersage steigt), während feature_4 den größten negativen Einfluss hat (wodurch die Vorhersage sinkt). Der endgültige vorhergesagte Wert liegt bei etwa 4.

Erforderliche Argumente

Argument

Beschreibung

shap_row

Eine pandas-Serie oder eine Snowpark-Zeile mit SHAP-Werten für eine bestimmte Instanz. SHAP-Werte geben an, wie viel jedes Feature zur Vorhersage beiträgt.

features_row

Eine pandas-Serie oder eine Snowpark-Zeile mit den tatsächlichen Feature-Werten für dieselbe Instanz enthält. Diese Werte werden zusammen mit ihren Beiträgen angezeigt.

Optionale Argumente

Argument

Beschreibung

base_value

Der Basiswert, der die durchschnittliche Vorhersage des Modells darstellt. Dieser Wert ist standardmäßig 0,0, sollte aber in der Regel auf den mittleren Vorhersagewert des Modells eingestellt werden.

figsize

Ein Tupel von (Breite, Höhe), das die Größe des Plots steuert. Verwendet eine Standardgröße von (1400, 500), wenn nicht anders angegeben.

contribution_threshold

Ein Float zwischen 0 und 1, der filtert, welche Features angezeigt werden sollen. Nur Features mit absoluten SHAP-Werten größer als dieser Schwellenwert (als Anteil an allen absoluten SHAP-Werten) werden angezeigt. Der Standardwert ist 0,05 (5 Prozent).

Die Funktion gibt ein Diagramm zurück, das die folgenden Elemente visualisiert:

  1. Die Vorhersage des Modells als Ausgangspunkt

  2. Positive Beiträge (Erhöhen der Vorhersage) in rot

  3. Negative Beiträge (Verringern der Vorhersage) in blau

  4. Feature-Namen, Feature-Werte und Einflusswerte als Anmerkungen

Die Visualisierung kann hilfreich sein, um die folgenden Datenpunkte zu verstehen:

  • Welche Features haben den größten Einfluss auf eine bestimmte Vorhersage?

  • Lenken die einzelnen Features die Vorhersage nach oben oder unten um?

  • Wie groß ist der Beitrag der einzelnen Features?

  • Mit welcher Feature-Kombination wird die endgültige Vorhersage erreicht?

Bemerkung

Wenn kein Feature den Schwellenwert erreicht oder ein ungültiger Schwellenwert angegeben ist (nicht zwischen 0 und 1), löst die Funktion eine SnowflakeMLException aus.