Snowpark Migration Accelerator: Versionshinweise¶
Bitte beachten Sie, dass die nachstehenden Versionshinweise nach Versionsdatum geordnet sind. Die Versionsnummern sowohl der Anwendung als auch des Konvertierungskerns werden unten angezeigt.
Version 2.10.4 (November 18, 2025)¶
Application & CLI Version: 2.10.4¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core: 8.1.8
Engine Release Notes¶
Korrigiert¶
Fixed an issue where the SMA generated corrupted Databricks notebook files in the output directory during Assessment mode execution.
Fixed an issue where the SMA would crash if the input directory contained folders named “SMA_ConvertedNotebooks”.
Version 2.10.3 (October 30, 2025)¶
Application & CLI Version: 2.10.3¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core: 8.1.7
Engine Release Notes¶
Hinzugefügt¶
Added the Snowpark Connect readiness score. This new score measures the percentage of Spark API references in your codebase that are supported by Snowpark Connect for Spark.
This will now be the only score shown in assessment mode. To generate the Snowpark API Readiness Score, run the SMA in conversion mode.
Added support for SQL embedded migration for literal string concatenations assigned to a local variable in the same scope of execution.
Included scenarios now include:
sqlStat = "SELECT colName " + "FROM myTable" session.sql(sqlStat)
Geändert¶
Updated the EWI URLs in the Issues.csv inventory to point to the main Snowflake documentation site.
Korrigiert¶
Fixed a code issue that caused inner project configuration files (e.g., pom.xml, build.sbt, build.gradle) to be incorrectly placed in the root of the output directory instead of the correct inner directories after migration.
Desktop Release Notes¶
Hinzugefügt¶
Added the Snowpark Connect readiness score and updated the assessment execution flow.
When running the application in assessment mode, only the Snowpark Connect readiness score is now displayed.
When running the application in conversion mode, the Snowpark API readiness score is displayed (the Snowpark Connect Readiness will not be shown).
Geändert¶
Updated all in-application documentation links to point to the official Snowflake documentation, replacing the legacy SnowConvert site.
Version 2.10.2 (Oct 27, 2025)¶
Application & CLI Version 2.10.2¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.73
Korrigiert¶
Fixed an issue where the Snowpark Migration Accelerator failed converting DBC files into Jupyter Notebooks properly.
Version 2.10.1 (23. Oktober 2025)¶
Anwendung und CLI Version 2.10.1¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.72
Hinzugefügt¶
Unterstützung für Snowpark Scala v1.17.0 hinzugefügt:
Von „Nicht unterstützt“ zu „Direkt“:
Datenset:
org.apache.spark.sql.Dataset.isEmpty→com.snowflake.snowpark.DataFrame.isEmpty
Zeile:
org.apache.spark.sql.Row.mkString→com.snowflake.snowpark.Row.mkString
StructType:
org.apache.spark.sql.types.StructType.fieldNames→com.snowflake.snowpark.types.StructType.fieldNames
Von „Nicht unterstützt“ zu „Umbenennen“:
Funktionen:
org.apache.spark.functions.flatten→com.snowflake.snowpark.functions.array_flatten
Von „Direkt“ zu „Umbenennen“:
Funktionen:
org.apache.spark.functions.to_date→com.snowflake.snowpark.functions.try_to_dateorg.apache.spark.functions.to_timestamp→com.snowflake.snowpark.functions.try_to_timestamp
Von „Direkter Unterstützung“ zu „Umbenennen“:
Funktionen:
org.apache.spark.sql.functions.concat_ws→com.snowflake.snowpark.functions.concat_ws_ignore_nulls
Von „Nicht definiert“ zu „Direkt“:
Funktionen:
org.apache.spark.functions.try_to_timestamp→com.snowflake.snowpark.functions.try_to_timestampEingebettete SQL wird jetzt migriert, wenn ein SQL-Anweisungsliteral einer lokalen Variablen zugewiesen wird.
Beispiel: sqlStat = “SELECT colName FROM myTable“ session.sql(sqlStat)
Eingebettete SQL wird jetzt für Verkettungen von literalen Zeichenfolgen unterstützt.
Beispiel: session.sql(“SELECT colName „ + „FROM myTable“)
Geändert¶
Die unterstützten Versionen von Snowpark Python API und Snowpark Pandas API wurden von 1.36.0 auf 1.39.0 aktualisiert.
Der Zuordnungsstatus für die folgenden PySpark xpath-Funktionen wurde von NotSupported auf „Direkt mit EWI SPRKPY1103“ aktualisiert:
pyspark.sql.functions.xpathpyspark.sql.functions.xpath_booleanpyspark.sql.functions.xpath_doublepyspark.sql.functions.xpath_floatpyspark.sql.functions.xpath_intpyspark.sql.functions.xpath_longpyspark.sql.functions.xpath_numberpyspark.sql.functions.xpath_shortpyspark.sql.functions.xpath_string
Der Zuordnungsstatus für die folgenden PySpark-Elemente wurde von NotDefined auf „Direkt“ aktualisiert:
pyspark.sql.functions.bit_and→snowflake.snowpark.functions.bitand_aggpyspark.sql.functions.bit_or→snowflake.snowpark.functions.bitor_aggpyspark.sql.functions.bit_xor→snowflake.snowpark.functions.bitxor_aggpyspark.sql.functions.getbit→snowflake.snowpark.functions.getbit
Der Zuordnungsstatus für die folgenden Pandas-Elemente wurde von NotSupported auf „Direkt“ aktualisiert:
pandas.core.indexes.base.Index→modin.pandas.Indexpandas.core.indexes.base.Index.get_level_values→modin.pandas.Index.get_level_values
Der Zuordnungsstatus für die folgenden PySpark-Funktionen wurde von NotSupported auf „Umbenennen“ aktualisiert:
pyspark.sql.functions.now→snowflake.snowpark.functions.current_timestamp
Korrigiert¶
Scala wurde korrigiert, da Importe nicht migriert wurden, wenn es eine Umbenennung gab.
Beispiel:
Quellcode:
.. code-block:: scala
package com.example.functions
import org.apache.spark.sql.functions.{to_timestamp, lit}
object ToTimeStampTest extends App { to_timestamp(lit(„sample“)) to_timestamp(lit(„sample“), „yyyy-MM-dd“) }Ausgabecode:
.. code-block:: scala
package com.example.functions
import com.snowflake.snowpark.functions.{try_to_timestamp, lit} import com.snowflake.snowpark_extensions.Extensions._ import com.snowflake.snowpark_extensions.Extensions.functions._
object ToTimeStampTest extends App { try_to_timestamp(lit(„sample“)) try_to_timestamp(lit(„sample“), „yyyy-MM-dd“) }
Version 2.10.0 (24. September 2025)¶
Anwendung und CLI Version 2.10.0¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.62
Hinzugefügt¶
Funktionalität zur Migration von SQL eingebettet in Interpolation des Python-Formats hinzugefügt.
Unterstützung für
DataFrame.select- undDataFrame.sort-Transformationen für eine größere Flexibilität bei der Datenverarbeitung hinzugefügt.
Geändert¶
Die unterstützten Versionen von Snowpark Python API und Snowpark Pandas API wurden auf 1.36.0 aktualisiert.
Der Zuordnungsstatus von
pandas.core.frame.DataFrame.boxplotwurde von „Nicht unterstützt“ auf „Direkt“ aktualisiert.Der Zuordnungsstatus von
DataFrame.select,Dataset.select,DataFrame.sortundDataset.sortwurde von „Direkt“ auf „Transformation“ aktualisiert.In Snowpark Scala kann eine Sequenz von Spalten direkt an die Auswahl- und Sortierfunktionen übergeben werden, sodass durch diese Transformation alle Verwendungen, wie beispielsweise
df.select(cols: _*)zudf.select(cols)unddf.sort(cols: _*)zudf.sort(cols)geändert werden.Die Python AST- und Parser-Version wurde auf 149.1.9 aktualisiert.
Der Status für pandas-Funktionen wurde auf „Direkt“ aktualisiert:
pandas.core.frame.DataFrame.to_excelpandas.core.series.Series.to_excelpandas.io.feather_format.read_featherpandas.io.orc.read_orcpandas.io.stata.read_stata
Der Status für
pyspark.sql.pandas.map_ops.PandasMapOpsMixin.mapInPandaswurde auf Umgehung des Problems mit EWI SPRKPY1102 aktualisiert.
Korrigiert¶
Problem behoben, das SqlEmbedded-Transformationen bei der Verwendung von verketteten Methodenaufrufen betraf.
Korrekturen bei Transformationen mit PySqlExpr unter Verwendung der neuen PyLiteralSql, um zu vermeiden, dass Details nicht verloren gehen.
Interne Stabilitätsprobleme wurden behoben, um die Robustheit und Zuverlässigkeit des Tools zu verbessern.
Version 2.7.7 (28. August 2025)¶
Anwendung und CLI Version 2.7.7¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.46
Hinzugefügt¶
Neue Pandas EWI-Dokumentation PNDSPY1011 hinzugefügt.
Unterstützung für die folgenden Pandas-Funktionen wurde hinzugefügt:
pandas.core.algorithms.unique
pandas.core.dtypes.missing.isna
pandas.core.dtypes.missing.isnull
pandas.core.dtypes.missing.notna
pandas.core.dtypes.missing.notnull
pandas.core.resample.Resampler.count
pandas.core.resample.Resampler.max
pandas.core.resample.Resampler.mean
pandas.core.resample.Resampler.median
pandas.core.resample.Resampler.min
pandas.core.resample.Resampler.size
pandas.core.resample.Resampler.sum
pandas.core.arrays.timedeltas.TimedeltaArray.total_seconds
pandas.core.series.Series.get
pandas.core.series.Series.to_frame
pandas.core.frame.DataFrame.assign
pandas.core.frame.DataFrame.get
pandas.core.frame.DataFrame.to_numpy
pandas.core.indexes.base.Index.is_unique
pandas.core.indexes.base.Index.has_duplicates
pandas.core.indexes.base.Index.shape
pandas.core.indexes.base.Index.array
pandas.core.indexes.base.Index.str
pandas.core.indexes.base.Index.equals
pandas.core.indexes.base.Index.identical
pandas.core.indexes.base.Index.unique
Unterstützung für die folgenden Funktionen von Spark Scala hinzugefügt:
org.apache.spark.sql.functions.format_number
org.apache.spark.sql.functions.from_unixtime
org.apache.spark.sql.functions.instr
org.apache.spark.sql.functions.months_between
org.apache.spark.sql.functions.pow
org.apache.spark.sql.functions.to_unix_timestamp
org.apache.spark.sql.Row.getAs
Geändert¶
Die Version von Snowpark Pandas API, unterstützt vom SMA, wurde auf 1.33.0 aktualisiert.
Die Version von Snowpark Scala API, unterstützt vom SMA, wurde auf 1.16.0 aktualisiert.
Der Zuordnungsstatus von „pyspark.sql.group.GroupedData.pivot“ wurde von „Transformation“ auf „Direkt“ aktualisiert.
Der Zuordnungsstatus von „org.apache.spark.sql.Builder.master“ wurde von NotSupported auf „Transformation“ aktualisiert. Diese Transformation entfernt alle Verwendungen dieses Elements, die während der Codekonvertierung identifiziert wurden.
Der Zuordnungsstatus von „org.apache.spark.sql.types.StructType.fieldIndex“ wurde von NotSupported auf „Direkt“ aktualisiert.
Der Zuordnungsstatus von „org.apache.spark.sql.Row.fieldIndex“ wurde von NotSupported auf „Direkt“ aktualisiert.
Der Zuordnungsstatus von „org.apache.spark.sql.SparkSession.stop“ wurde von NotSupported auf „Umbenennen“ aktualisiert. Alle identifizierten Verwendungen dieses Elements werden während der Codekonvertierung in „com.snowflake.snowpark.Session.close“ umbenannt.
Der Zuordnungsstatus von „org.apache.spark.sql.DataFrame.unpersist“ und „org.apache.spark.sql.Dataset.unpersist“ wurde von NotSupported auf „Transformation“ aktualisiert. Diese Transformation entfernt alle Verwendungen dieses Elements, die während der Codekonvertierung identifiziert wurden.
Korrigiert¶
Korrektur des Fortsetzungs-Backslashs bei entfernten Funktionen.
Das Problem mit der Spalte LIBRARY_PREFIX in der ConversionStatusLibraries.csv-Datei wurde behoben, um den richtigen Bezeichner für die scikit-learn-Bibliotheksfamilie (scikit-*) zu verwenden.
Fehler wurde behoben, bei dem mehrzeilige gruppierte Operationen nicht analysiert wurden.
Version 2.9.0 (09. September 2025)¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.53
Hinzugefügt¶
Die folgenden Zuordnungen werden nun für
org.apache.spark.sql.Dataset[T]ausgeführt:org.apache.spark.sql.Dataset.unionist jetztcom.snowflake.snowpark.DataFrame.unionAllorg.apache.spark.sql.Dataset.unionByNameist jetztcom.snowflake.snowpark.DataFrame.unionAllByName
Unterstützung für
org.apache.spark.sql.functions.broadcastals Transformation wurde hinzugefügt.
Geändert¶
Die unterstützte Snowpark Python API-Version für SMA wurde von
1.27.0auf1.33.0aktualisiert.Der Status für die
pyspark.sql.function.randn-Funktion wurde auf „Direkt“ aktualisiert.
Korrigiert¶
Das Problem wurde behoben, bei dem
org.apache.spark.SparkContext.parallelizenicht aufgelöst wurde und das nun als Transformation unterstützt wird.Das Problem mit der
Dataset.persist-Transformation wurde behoben, um mit jeder Art von Datenset zu arbeiten, nicht nur mitDatenset[Zeile].
Version 2.7.6 (17. Juli 2025)¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.30
Hinzugefügt¶
Die Zuordnungen für spark.DataReader-Methoden wurden angepasst.
DataFrame.unionist jetztDataFrame.unionAll.DataFrame.unionByNameist jetztDataFrame.unionAllByName.Spalten mit mehrstufigen Artefaktabhängigkeiten wurden im Artefaktinventar hinzugefügt
Eine neue Pandas EWIs-Dokumentation von
PNDSPY1005zuPNDSPY1010wurde hinzugefügt.Eine bestimmte EWI für
pandas.core.series.Series.applywurde hinzugefügt.
Geändert¶
Die Version von Snowpark Pandas API, unterstützt vom SMA, wurde von
1.27.0auf1.30.0aktualisiert.
Korrigiert¶
Das Problem mit fehlenden Werten in der Formel wurde behoben, um die SQL-Bereitschaftsbewertung zu erhalten.
Der Fehler wurde behoben, der dazu führte, dass einige Pandas-Elemente die standardmäßige EWI-Nachricht von PySpark aufwiesen.
Version 2.7.5 (2. Juli 2025)¶
Anwendung und CLI Version 2.7.5¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.19
Geändert¶
Überarbeitete Pandas-Importe: Pandas-Importe verwenden jetzt `modin.pandas` anstelle von
snowflake.snowpark.modin.pandas.Verbesserte `dbutils` und Magic Commands Transformation:
Eine neue
sfutils.py-Datei wird jetzt generiert, und alledbutils-Präfixe werden durchsfutilsersetzt.Für Databricks (DBX)-Notebooks wird ein impliziter Import für
sfutilsautomatisch hinzugefügt.Das
sfutils-Modul simuliert verschiedenedbutils-Methoden, einschließlich Dateisystemvorgänge (dutils.fs) über einen definierten Snowflake FileSystem (SFFS)-Stagingbereich und übernimmt die Ausführung des Notebooks (dutils.notebook.run), indem dieses inEXECUTE NOTEBOOKSQL-Funktionen umgewandelt wird.dbutils.notebook.exitwird entfernt, da es in Snowflake nicht erforderlich ist.
Korrigiert¶
Aktualisierungen in SnowConvert-Berichte: SnowConvert-Berichte enthalten jetzt die Spalte CellId, wenn Instanzen vom SMA stammen und die Spalte FileName den vollständigen Pfad anzeigt.
Aktualisierte Artefakt-Abhängigkeit für SnowConvert-Berichte: Der Artefakt-Inventarbericht von SMA, der zuvor durch die Integration von SnowConvert beeinträchtigt wurde, wurde wiederhergestellt. Diese Aktualisierung aktiviert das SMA-Tool zur genauen Erfassung und Analyse von Object References und Missing Object References direkt aus SnowConvert-Berichten, um sicherzustellen, dass die SQL-Abhängigkeiten für das Inventar korrekt abgerufen werden.
Version 2.7.4 (26. Juni 2025)¶
Anwendung und CLI Version 2.7.4¶
Desktop-App
Hinzugefügt¶
Verbesserungen für die Telemetrie wurden hinzugefügt.
Korrigiert¶
Korrektur der Dokumentationslinks im Popup-Fenster für Konvertierungseinstellungen und in Pandas EWIs.
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.16
Hinzugefügt¶
Transformieren von Spark XML in Snowpark
Databricks SQL-Option in der SQL-Quellsprache
Transformieren von JDBC-Leseverbindungen.
Geändert¶
Alle SnowConvert-Berichte werden in die Backup-ZIP-Datei kopiert.
Der Ordner wird von
SqlReportsinSnowConvertReportsumbenannt.SqlFunctionsInventorywird in den OrdnerBerichteverschoben.Alle SnowConvert-Berichte werden an die Telemetrie gesendet.
Korrigiert¶
Nicht deterministisches Problem mit SQL-Bereitschaftsbewertung.
Das Problem mit falsch-positivem kritischen Ergebnis wurde behoben, das den Desktop zum Absturz brachte.
Das Problem wurde behoben, durch das im Abhängigkeitsbericht für Artefakte die SQL-Objekte nicht angezeigt wurden.
Version 2.7.2 (10. Juni 2025)¶
Anwendung und CLI Version 2.7.2¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.2
Korrigiert¶
Das Problem mit der SMA-Ausführung unter dem neuesten Windows OS wurde behoben, wie bereits berichtet. Mit dieser Maßnahme werden die in Version 2.7.1 aufgetretenen Probleme behoben.
Version 2.7.1 (9. Juni 2025)¶
Anwendung und CLI Version 2.7.1¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 8.0.1
Hinzugefügt¶
Der Snowpark Migration Accelerator (SMA) orchestriert nun SnowConvert, um die in Benutzer-Workloads gefundene SQL zu verarbeiten, einschließlich eingebetteter SQL in Python- bzw. Scala-Code, Notebook SQL-Zellen, .sql-Dateien und .hql-Dateien.
SnowConvert verbessert nun die vorherigen SMA-Fähigkeiten:
Ein neuer Ordner in den Berichten mit dem Namen SQL Berichte enthält die von SnowConvert generierten Berichte.
Bekannte Probleme¶
Die vorherige SMA-Version für SQL-Berichte wird in folgenden Fällen leer angezeigt:
Für
Berichte/SqlElementsInventory.csv, teilweise durchBerichte/SqlReports/Elements.yyyymmdd.hhmmss.csv.abgedecktFür
Berichte/SqlFunctionsInventory.csvsiehe den neuen Speicherort mit demselben Namen unterBerichte/SqlReports/SqlFunctionsInventory.csv
Das Inventar der Artefakt-Abhängigkeiten:
Im
ArtifactDependencyInventorywird die Spalte für das SQL-Objekt leer angezeigt
Version 2.6.10 (5. Mai 2025)¶
Anwendung und CLI Version 2.6.10¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 7.4.0
Korrigiert¶
Das Problem mit falschen Werten in der Datei „checkpoints.json“ wurde behoben.
Der Wert „sample“ war ohne Dezimalstellen (bei ganzzahligen Werten) und Anführungszeichen.
Der Wert „entrypoint“ enthielt Punkte anstelle von Schrägstrichen, und es fehlte die Dateierweiterung.
Der Standardwert wurde in TRUE für die Einstellung „DBX-Notebooks in Snowflake-Notebooks konvertieren“ geändert
Version 2.6.8 (28. April 2025)¶
Anwendung und CLI Version 2.6.8¶
Desktop-App¶
Mechanismus zur Erkennung von Checkpoints und Ausführungseinstellungen hinzugefügt.
Mechanismus zum Sammeln von DBX-Magic-Befehlen in DbxElementsInventory.csv hinzugefügt
Die Generierung von „checkpoints.json“ wurde zum Eingabeverzeichnis hinzugefügt.
Eine neue EWI wurde für alle nicht unterstützten Magic-Befehle hinzugefügt.
Die Sammlung von dbutils wurde zu DbxElementsInventory.csv von Scala-Quell-Notebooks hinzugefügt
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 7.2.53
Geändert¶
Aktualisierungen zur Verarbeitung von Transformationen von DBX Scala-Elementen zu Jupyter Python-Elementen und zum Kommentieren des gesamten Codes der Zelle.
Aktualisierungen zur Verarbeitung von Transformationen aus den Befehlen dutils.notebook.run und „r“; für den letzten Befehl auch den gesamten Code der Zelle auskommentieren.
Name und Buchstabe des Schlüssels wurden aktualisiert, um die Konvertierung der Notebook-Dateien zu ermöglichen.
Korrigiert¶
Es wurde ein Fehler behoben, der bei der Transformation von DBX-Notebooks in .ipynb-Dateien dazu führte, dass das falsche Format vorhanden war.
Es wurde ein Fehler behoben, der dazu führte, dass .py DBX-Notebooks nicht in .ipynb-Dateien umgewandelt werden konnten.
Es wurde ein Fehler behoben, der dazu führte, dass Kommentare im Ausgabecode von DBX-Notebooks fehlten.
Es wurde ein Fehler behoben, der dazu führte, dass Scala-Rohdateien in ipynb-Dateien konvertiert wurden.
Version 2.6.7 (21. April 2025)¶
Anwendung und CLI Version 2.6.7¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 7.2.42
Geändert¶
DataFramesInventory wurde zum Füllen der Spalte EntryPoints aktualisiert
Version 2.6.6 (7. April 2025)¶
Anwendung und CLI Version 2.6.6¶
Desktop-App¶
Hinzugefügt¶
Aktualisierung von DBx EWI-Link in der UI-Ergebnisseite
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 7.2.39
Hinzugefügt¶
Generierung des Inventars für Ausführungsablauf hinzugefügt.
Implizites Sitzungs-Setup zu jeder DBx-Notebook-Transformation hinzugefügt
Geändert¶
DbUtilsUsagesInventory.csv wurde in DbxElementsInventory.csv umbenannt
Korrigiert¶
Es wurde ein Fehler behoben, der einen Fehler beim Parsen verursachte, wenn nach einem Typhinweis ein Backslash folgte.
Korrektur von relativen Importen, die nicht mit einem Punkt beginnen, und relativen Importen mit einem Stern.
Version 2.6.5 (27. März 2025)¶
Anwendung und CLI Version 2.6.5¶
Desktop-App¶
Hinzugefügt¶
Ein neuer Umschalter für Konvertierungseinstellungen wurde hinzugefügt, um das Sma-Checkpoints-Feature zu aktivieren oder zu deaktivieren.
Es wurde ein Berichtsfehler behoben, damit kein Absturz erfolgt, wenn die Post-API 500 zurückgibt
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 7.2.26
Hinzugefügt¶
Die Generierung der Datei „checkpoints.json“ im Ausgabeordner wurde auf der Grundlage von DataFramesInventory.csv hinzugefügt.
Flag „disableCheckpoints“ wurde zu CLI-Befehlen und zusätzlichen Parametern des Codeprozessors hinzugefügt.
Eine neue Ersetzung für Python wurde hinzugefügt, um den Knoten „dbutils.notebook.run“ zu transformieren.
Neue Ersetzungen wurden hinzugefügt, um den magischen Befehl %run umzuwandeln.
Neue Ersetzungen (Python und Scala) wurden hinzugefügt, um den Knoten „dbutils.notebook.exit“ zu entfernen.
Die Spalte „Speicherort“ wurde zum Inventar der Artefakte hinzugefügt.
Geändert¶
Das in einigen Teilen der Lösung verwendete normalisierte Trennzeichen für Verzeichnisse wurde überarbeitet.
Zentralisiert die Handhabung von Namen des DBC-Extraktionsarbeitsordners
Version von Snowpark und Pandas auf v1.27.0 aktualisiert
Inventarspalten für Artefakte wurden aktualisiert auf:
Name > Abhängigkeit
Datei -> FileId
Status > Status_detail
Eine neue Spalte zum Inventar von Artefakten wurde hinzugefügt:
Erfolg
Korrigiert¶
Datenframes-Inventar wurde nicht korrekt in den Stagingbereich hochgeladen.
Version 2.6.4 (12. März 2025)¶
Anwendung und CLI Version 2.6.4¶
Enthaltene SMA Core-Versionen ¶
Snowpark Conversion Core 7.2.0
wurde hinzugefügt¶
Ein Inventar der Artefaktabhängigkeiten
Eine Ersetzung und EWI für pyspark.sql.types.StructType.fieldNames-Methode für snowflake.snowpark.types.StructType.fieldNames-Attribut.
Die folgenden PySpark-Funktionen mit dem Status:
Direct Status
pyspark.sql.functions.bitmap_bit_positionpyspark.sql.functions.bitmap_bucket_numberpyspark.sql.functions.bitmap_construct_aggpyspark.sql.functions.equal_nullpyspark.sql.functions.ifnullpyspark.sql.functions.localtimestamppyspark.sql.functions.max_bypyspark.sql.functions.min_bypyspark.sql.functions.nvlpyspark.sql.functions.regr_avgxpyspark.sql.functions.regr_avgypyspark.sql.functions.regr_countpyspark.sql.functions.regr_interceptpyspark.sql.functions.regr_slopepyspark.sql.functions.regr_sxxpyspark.sql.functions.regr_sxypyspark.sql.functions.regr
NotSupported
pyspark.sql.functions.map_contains_keypyspark.sql.functions.positionpyspark.sql.functions.regr_r2pyspark.sql.functions.try_to_binary
Die folgenden Pandas-Funktionen mit Status
pandas.core.series.Series.str.ljustpandas.core.series.Series.str.centerpandas.core.series.Series.str.padpandas.core.series.Series.str.rjust
Aktualisieren Sie die folgenden Pyspark-Funktionen mit dem Status
Von WorkAround zu „Direkt“
pyspark.sql.functions.acoshpyspark.sql.functions.asinhpyspark.sql.functions.atanhpyspark.sql.functions.instrpyspark.sql.functions.log10pyspark.sql.functions.log1ppyspark.sql.functions.log2
Von NotSupported zu „Direkt“
pyspark.sql.functions.bit_lengthpyspark.sql.functions.cbrtpyspark.sql.functions.nth_valuepyspark.sql.functions.octet_lengthpyspark.sql.functions.base64pyspark.sql.functions.unbase64
Die folgenden Pandas-Funktionen wurden mit dem Status aktualisiert
Von NotSupported zu „Direkt“
pandas.core.frame.DataFrame.poppandas.core.series.Series.betweenpandas.core.series.Series.pop
Version 2.6.3 (6. März 2025)¶
Anwendung und CLI Version 2.6.3¶
Enthaltene SMA Core-Versionen ¶
Snowpark Conversion Core 7.1.13
wurde hinzugefügt¶
Die CSV-Generator-Klasse für neue Inventarerstellung wurde hinzugefügt.
Die Spalte „full_name“ zum Importieren des Nutzungsinventars wurde hinzugefügt.
Die Transformation von „pyspark.sql.functions.concat_ws“ zu „snowflake.snowpark.functions._concat_ws_ignore_nulls“ wurde hinzugefügt.
Die Logik zur Generierung von „checkpoints.json“ wurde hinzugefügt.
Inventare wurden hinzugefügt:
DataFramesInventory.csv.
CheckpointsInventory.csv
Version 2.6.0 (21. Februar 2025)¶
Anwendung und CLI Version 2.6.0¶
Desktop-App ¶
Die Lizenzvereinbarung wurde aktualisiert, Akzeptanz ist erforderlich.
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 7.1.2
Hinzugefügt
Updated the mapping status for the following PySpark elements, from NotSupported to Direct
pyspark.sql.types.ArrayType.jsonpyspark.sql.types.ArrayType.jsonValuepyspark.sql.types.ArrayType.simpleStringpyspark.sql.types.ArrayType.typeNamepyspark.sql.types.AtomicType.jsonpyspark.sql.types.AtomicType.jsonValuepyspark.sql.types.AtomicType.simpleStringpyspark.sql.types.AtomicType.typeNamepyspark.sql.types.BinaryType.jsonpyspark.sql.types.BinaryType.jsonValuepyspark.sql.types.BinaryType.simpleStringpyspark.sql.types.BinaryType.typeNamepyspark.sql.types.BooleanType.jsonpyspark.sql.types.BooleanType.jsonValuepyspark.sql.types.BooleanType.simpleStringpyspark.sql.types.BooleanType.typeNamepyspark.sql.types.ByteType.jsonpyspark.sql.types.ByteType.jsonValuepyspark.sql.types.ByteType.simpleStringpyspark.sql.types.ByteType.typeNamepyspark.sql.types.DecimalType.jsonpyspark.sql.types.DecimalType.jsonValuepyspark.sql.types.DecimalType.simpleStringpyspark.sql.types.DecimalType.typeNamepyspark.sql.types.DoubleType.jsonpyspark.sql.types.DoubleType.jsonValuepyspark.sql.types.DoubleType.simpleStringpyspark.sql.types.DoubleType.typeNamepyspark.sql.types.FloatType.jsonpyspark.sql.types.FloatType.jsonValuepyspark.sql.types.FloatType.simpleStringpyspark.sql.types.FloatType.typeNamepyspark.sql.types.FractionalType.jsonpyspark.sql.types.FractionalType.jsonValuepyspark.sql.types.FractionalType.simpleStringpyspark.sql.types.FractionalType.typeNamepyspark.sql.types.IntegerType.jsonpyspark.sql.types.IntegerType.jsonValuepyspark.sql.types.IntegerType.simpleStringpyspark.sql.types.IntegerType.typeNamepyspark.sql.types.IntegralType.jsonpyspark.sql.types.IntegralType.jsonValuepyspark.sql.types.IntegralType.simpleStringpyspark.sql.types.IntegralType.typeNamepyspark.sql.types.LongType.jsonpyspark.sql.types.LongType.jsonValuepyspark.sql.types.LongType.simpleStringpyspark.sql.types.LongType.typeNamepyspark.sql.types.MapType.jsonpyspark.sql.types.MapType.jsonValuepyspark.sql.types.MapType.simpleStringpyspark.sql.types.MapType.typeNamepyspark.sql.types.NullType.jsonpyspark.sql.types.NullType.jsonValuepyspark.sql.types.NullType.simpleStringpyspark.sql.types.NullType.typeNamepyspark.sql.types.NumericType.jsonpyspark.sql.types.NumericType.jsonValuepyspark.sql.types.NumericType.simpleStringpyspark.sql.types.NumericType.typeNamepyspark.sql.types.ShortType.jsonpyspark.sql.types.ShortType.jsonValuepyspark.sql.types.ShortType.simpleStringpyspark.sql.types.ShortType.typeNamepyspark.sql.types.StringType.jsonpyspark.sql.types.StringType.jsonValuepyspark.sql.types.StringType.simpleStringpyspark.sql.types.StringType.typeNamepyspark.sql.types.StructType.jsonpyspark.sql.types.StructType.jsonValuepyspark.sql.types.StructType.simpleStringpyspark.sql.types.StructType.typeNamepyspark.sql.types.TimestampType.jsonpyspark.sql.types.TimestampType.jsonValuepyspark.sql.types.TimestampType.simpleStringpyspark.sql.types.TimestampType.typeNamepyspark.sql.types.StructField.simpleStringpyspark.sql.types.StructField.typeNamepyspark.sql.types.StructField.jsonpyspark.sql.types.StructField.jsonValuepyspark.sql.types.DataType.jsonpyspark.sql.types.DataType.jsonValuepyspark.sql.types.DataType.simpleStringpyspark.sql.types.DataType.typeNamepyspark.sql.session.SparkSession.getActiveSessionpyspark.sql.session.SparkSession.versionpandas.io.html.read_htmlpandas.io.json._normalize.json_normalizepyspark.sql.types.ArrayType.fromJsonpyspark.sql.types.MapType.fromJsonpyspark.sql.types.StructField.fromJsonpyspark.sql.types.StructType.fromJsonpandas.core.groupby.generic.DataFrameGroupBy.pct_changepandas.core.groupby.generic.SeriesGroupBy.pct_change
Der Zuordnungsstatus für die folgenden Pandas-Elemente wurde von NotSupported auf Direkt aktualisiert
pandas.io.html.read_htmlpandas.io.json._normalize.json_normalizepandas.core.groupby.generic.DataFrameGroupBy.pct_changepandas.core.groupby.generic.SeriesGroupBy.pct_change
Der Zuordnungsstatus für die folgenden PySpark-Elemente wurde von Umbenennen auf Direkt aktualisiert
pyspark.sql.functions.collect_listpyspark.sql.functions.size
wurde behoben¶
Das Format der Versionsnummer in den Inventaren wurde vereinheitlicht.
Version 2.5.2 (5. Februar 2025)¶
Hotfix: Anwendung & CLI Version 2.5.2¶
Desktop-App¶
Ein Problem bei der Konvertierung in der Beispielprojektoption wurde behoben.
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 5.3.0
Version 2.5.1 (4. Februar 2025)¶
Anwendung & CLI Version 2.5.1¶
Desktop-App¶
Es wurde ein neues Modal hinzugefügt, wenn der Benutzer keine Schreibberechtigung hat.
Die Lizenzvereinbarung wurde aktualisiert, die Zustimmung ist erforderlich.
CLI¶
Die Jahreszahl auf dem CLI-Bildschirm bei der Anzeige von „–version“ oder „-v“ wurde korrigiert
Enthaltene SMA Core-Versionen included-sma-core-versions¶
Snowpark Conversion Core 5.3.0
Hinzugefügt¶
Added the following Python Third-Party libraries with Direct status:
about-timeaffinegapaiohappyeyeballsalibi-detectalive-progressallure-nose2allure-robotframeworkanaconda-cloud-clianaconda-mirrorastropy-iers-dataasynchasyncsshautotsautovimlaws-msk-iam-sasl-signer-pythonazure-functionsbackports.tarfileblasbottlebsoncairocapnprotocaptumcategorical-distancecensusclickhouse-driverclustergramcmaconda-anaconda-telemetrieconfigspacecpp-expecteddask-exprdata-science-utilsdatabricks-sdkdatetime-distancedb-dtypesdedupededupe-variable-datetimededupe_lehvenshtein_searchdedupe_levenshtein_searchdiff-coverdiptestdmglibdocstring_parserdoppelmetaphondspy-aieconmlemceeemojienvironseth-abieth-hasheth-typingeth-utilsexpatfiletypefitterflask-corsfpdf2frozendictgcabgeojsongettextglib-toolsgoogle-adsgoogle-ai-generativelanguagegoogle-api-python-clientgoogle-auth-httplib2google-cloud-bigquerygoogle-cloud-bigquery-coregoogle-cloud-bigquery-storagegoogle-cloud-bigquery-storage-coregoogle-cloud-ressourcen-managergoogle-generativeaigooglemapsgraphemegraphenegraphql-relaygravisgreykitegrpc-google-iam-v1harfbuzzhatch-fancy-pypi-readmehaversinehiclasshicolor-icon-themehigheredhmmlearnholidays-exthttplib2icuimbalanced-ensembleimmutabledictimportlib-metadataimportlib-resourcesinquirerpyiterative-telemetryjaraco.contextjaraco.testjiterjiwerjoserfcjsoncppjsonpathjsonpath-ngjsonpath-pythonkagglehubkeplerglkt-legacylangchain-communitylangchain-experimentallangchain-snowflakelangchain-text-splitterslibabseillibflaclibgfortran-nglibgfortran5libgliblibgomplibgrpclibgsflibmagiclibogglibopenblaslibpostallibprotobuflibsentencepiecelibsndfilelibstdcxx-nglibtheoralibtifflibvorbislibwebpleichtgewicht-mmmlitestarlitestar-with-annotated-typeslitestar-with-attrslitestar-with-cryptographylitestar-with-jinjalitestar-with-jwtlitestar-with-prometheuslitestar-with-structloglunarcalendar-extmatplotlib-vennmetricksmimesismodin-raymomepympg123msgspecmsgspec-tomlmsgspec-yamlmsitoolsmultipartnamexnbconvert-allnbconvert-corenbconvert-pandocnlohmann_jsonnumba-cudanumpyrooffice365-rest-python-clientopenapi-pydanticopentelemetry-distroopentelemetry-instrumentationopentelemetry-instrumentation-system-metricsoptreeosmnxpathlibpdf2imagepfzypgpyplumbumpm4pypolarspolyfactorypoppler-cpppostalpre-commitprompt-toolkitpropcachepy-partiql-parserpy_stringmatchingpyatlanpyfakefspyfhelpyhacrf-datamadepyicebergpykrb5pylbfgspymilvuspymoopynisherpyomopypdfpypdf-with-cryptopypdf-with-fullpypdf-with-imagepypngpyprindpyrfrpysoundfilepytest-codspeedpytest-triopython-barcodepython-boxpython-docxpython-gssapipython-iso639python-magicpython-pandocpython-zstdpyucapyvinecopulibpyxirrqrcoderai-sdkray-clientray-observabilityreadlinerich-clickrouge-scoreruffscikit-criteriascikit-mobilitysentencepiece-pythonsentencepiece-spmsetuptools-markdownsetuptools-scmsetuptools-scm-git-archiveshareplumsimdjsonsimplecosinesis-extrasslack-sdksmacsnowflake-sqlalchemysnowflake_legacysocrata-pyspdlogsphinxcontrib-imagessphinxcontrib-jquerysphinxcontrib-youtubesplunk-opentelemetrysqlfluffsquarifyst-themestatisticsstreamlit-antd-componentsstreamlit-condition-treestreamlit-echartsstreamlit-feedbackstreamlit-keplerglstreamlit-mermaidstreamlit-navigation-barstreamlit-option-menustrictyamlstringdistsybiltensorflow-cputensorflow-texttiledb-ptorchaudiotorchevaltrio-websockettrulens-connectors-snowflaketrulens-coretrulens-dashboardtrulens-feedbacktrulens-otel-semconvtrulens-providers-cortextsdownsampletypingtyping-extensionstyping_extensionsunittest-xml-reportinguritemplateusuuid6wfdbwsprotozlibzope.index
Added the following Python BuiltIn libraries with Direct status:
aifcArrayastasynchatasyncioasyncoreatexitaudioopbase64bdbbinasciibitsectbuiltinsbz2calendarcgicgitbchunkcmathcmdcodecodecscodeopcolorsyscompileallconcurrentcontextlibcontextvarscopycopyregcprofilecryptcsvctypescursesdbmdifflibdisdistutilsdoctestemailensurepipenumerrnofaulthandlerfcntlfilecmpfileinputfnmatchfractionsftplibfunctoolsgcgetoptgetpassgettextgraphlibgrpgziphashlibheapqhmachtmlhttpidlelibimaplibimghdrimpimportlibinspectipaddressitertoolskeywordlinecachelocalelzmamailboxmailcapmarshalmathmimetypesmmapmodulefindermsilibmultiprocessingnetrcnisnntplibnumbersoperatoroptparseossaudiodevpdbpicklepickletoolspipespkgutilplatformplistlibpoplibposixpprintprofilepstatsptypwdpy_compilepyclbrpydocqueuequoprirandomrereprlibressourcerlcompleterrunpyschedGeheimnisseselectselectorsshelveshlexsignalsitesitecustomizesmtpdsmtplibsndhdrsocketsocketserverspwdsqlite3sslstatstringstringprepstructsubprocesssunausymtablesysconfigsyslogtabnannytarfiletelnetlibtempfiletermiostesttextwrapthreadingtimeittkinterTokentokenizetomllibtracetracebacktracemallocttyturtleturtledemotypesunicodedataurllibuuuuidvenvwarningswaveweakrefwebbrowserwsgirefxdrlibxmlxmlrpczipappzipfilezipimportzoneinfo
Added the following Python BuiltIn libraries with NotSupported status:
msvcrtwinregwinsound
Geändert¶
Aktualisieren Sie .NET auf Version v9.0.0.
Verbessert EWI SPRKPY1068.
Die von SMA unterstützte Version von Snowpark Python API wurde von 1.24.0 auf 1.25.0 erhöht.
Die detaillierte Berichtsvorlage wurde aktualisiert und enthält jetzt die Snowpark-Version für Pandas.
Die folgenden Bibliotheken wurden von ThirdPartyLib auf BuiltIn geändert.
configparserdataclassespathlibreadlinestatisticszlib
Updated the mapping status for the following Pandas elements, from Direct to Partial:
pandas.core.frame.DataFrame.addpandas.core.frame.DataFrame.aggregatepandas.core.frame.DataFrame.allpandas.core.frame.DataFrame.applypandas.core.frame.DataFrame.astypepandas.core.frame.DataFrame.cumsumpandas.core.frame.DataFrame.divpandas.core.frame.DataFrame.dropnapandas.core.frame.DataFrame.eqpandas.core.frame.DataFrame.ffillpandas.core.frame.DataFrame.fillnapandas.core.frame.DataFrame.floordivpandas.core.frame.DataFrame.gepandas.core.frame.DataFrame.groupbypandas.core.frame.DataFrame.gtpandas.core.frame.DataFrame.idxmaxpandas.core.frame.DataFrame.idxminpandas.core.frame.DataFrame.infpandas.core.frame.DataFrame.joinpandas.core.frame.DataFrame.lepandas.core.frame.DataFrame.locpandas.core.frame.DataFrame.ltpandas.core.frame.DataFrame.maskpandas.core.frame.DataFrame.mergepandas.core.frame.DataFrame.modpandas.core.frame.DataFrame.mulpandas.core.frame.DataFrame.nepandas.core.frame.DataFrame.nuniquepandas.core.frame.DataFrame.pivot_tablepandas.core.frame.DataFrame.powpandas.core.frame.DataFrame.raddpandas.core.frame.DataFrame.rankpandas.core.frame.DataFrame.rdivpandas.core.frame.DataFrame.renamepandas.core.frame.DataFrame.replacepandas.core.frame.DataFrame.resamplepandas.core.frame.DataFrame.rfloordivpandas.core.frame.DataFrame.rmodpandas.core.frame.DataFrame.rmulpandas.core.frame.DataFrame.rollingpandas.core.frame.DataFrame.roundpandas.core.frame.DataFrame.rpowpandas.core.frame.DataFrame.rsubpandas.core.frame.DataFrame.rtruedivpandas.core.frame.DataFrame.shiftpandas.core.frame.DataFrame.skewpandas.core.frame.DataFrame.sort_indexpandas.core.frame.DataFrame.sort_valuespandas.core.frame.DataFrame.subpandas.core.frame.DataFrame.to_dictpandas.core.frame.DataFrame.transformpandas.core.frame.DataFrame.transposepandas.core.frame.DataFrame.truedivpandas.core.frame.DataFrame.varpandas.core.indexes.datetimes.date_rangepandas.core.reshape.concat.concatpandas.core.reshape.melt.meltpandas.core.reshape.merge.mergepandas.core.reshape.pivot.pivot_tablepandas.core.reshape.tile.cutpandas.core.series.Series.addpandas.core.series.Series.aggregatepandas.core.series.Series.allpandas.core.series.Series.anypandas.core.series.Series.cumsumpandas.core.series.Series.divpandas.core.series.Series.dropnapandas.core.series.Series.eqpandas.core.series.Series.ffillpandas.core.series.Series.fillnapandas.core.series.Series.floordivpandas.core.series.Series.gepandas.core.series.Series.gtpandas.core.series.series.ltpandas.core.series.Series.maskpandas.core.series.Series.modpandas.core.series.Series.mulpandas.core.series.Series.multiplypandas.core.series.Series.nepandas.core.series.Series.powpandas.core.series.Series.quantilepandas.core.series.Series.raddpandas.core.series.Series.rankpandas.core.series.Series.rdivpandas.core.series.Series.renamepandas.core.series.Series.replacepandas.core.series.Series.resamplepandas.core.series.Series.rfloordivpandas.core.series.Series.rmodpandas.core.series.Series.rmulpandas.core.series.Series.rollingpandas.core.series.Series.rpowpandas.core.series.Series.rsubpandas.core.series.Series.rtruedivpandas.core.series.Series.samplepandas.core.series.Series.shiftpandas.core.series.Series.skewpandas.core.series.Series.sort_indexpandas.core.series.Series.sort_valuespandas.core.series.Series.stdpandas.core.series.Series.subpandas.core.series.Series.subtractpandas.core.series.Series.truedivpandas.core.series.Series.value_countspandas.core.series.Series.varpandas.core.series.Series.wherepandas.core.tools.numeric.to_numeric
Updated the mapping status for the following Pandas elements, from NotSupported to Direct:
pandas.core.frame.DataFrame.attrspandas.core.indexes.base.Index.to_numpypandas.core.series.Series.str.lenpandas.io.html.read_htmlpandas.io.xml.read_xmlpandas.core.indexes.datetimes.DatetimeIndex.meanpandas.core.resample.Resampler.indicespandas.core.resample.Resampler.nuniquepandas.core.series.Series.itemspandas.core.tools.datetimes.to_datetimepandas.io.sas.sasreader.read_saspandas.core.frame.DataFrame.attrspandas.core.frame.DataFrame.stylepandas.core.frame.DataFrame.itemspandas.core.groupby.generic.DataFrameGroupBy.headpandas.core.groupby.generic.DataFrameGroupBy.medianpandas.core.groupby.generic.DataFrameGroupBy.minpandas.core.groupby.generic.DataFrameGroupBy.nuniquepandas.core.groupby.generic.DataFrameGroupBy.tailpandas.core.indexes.base.Index.is_booleanpandas.core.indexes.base.Index.is_floatingpandas.core.indexes.base.Index.is_integerpandas.core.indexes.base.Index.is_monotonic_decreasingpandas.core.indexes.base.Index.is_monotonic_increasingpandas.core.indexes.base.Index.is_numericpandas.core.indexes.base.Index.is_objectpandas.core.indexes.base.Index.maxpandas.core.indexes.base.Index.minpandas.core.indexes.base.Index.namepandas.core.indexes.base.Index.namespandas.core.indexes.base.Index.renamepandas.core.indexes.base.Index.set_namespandas.core.indexes.datetimes.DatetimeIndex.day_namepandas.core.indexes.datetimes.DatetimeIndex.month_namepandas.core.indexes.datetimes.DatetimeIndex.timepandas.core.indexes.timedeltas.TimedeltaIndex.ceilpandas.core.indexes.timedeltas.TimedeltaIndex.dayspandas.core.indexes.timedeltas.TimedeltaIndex.floorpandas.core.indexes.timedeltas.TimedeltaIndex.microsecondspandas.core.indexes.timedeltas.TimedeltaIndex.nanosecondspandas.core.indexes.timedeltas.TimedeltaIndex.roundpandas.core.indexes.timedeltas.TimedeltaIndex.secondspandas.core.reshape.pivot.crosstabpandas.core.series.Series.dt.roundpandas.core.series.Series.dt.timepandas.core.series.Series.dt.weekdaypandas.core.series.Series.is_monotonic_decreasingpandas.core.series.Series.is_monotonic_increasing
Updated the mapping status for the following Pandas elements, from NotSupported to Partial:
pandas.core.frame.DataFrame.alignpandas.core.series.Series.alignpandas.core.frame.DataFrame.tz_convertpandas.core.frame.DataFrame.tz_localizepandas.core.groupby.generic.DataFrameGroupBy.fillnapandas.core.groupby.generic.SeriesGroupBy.fillnapandas.core.indexes.datetimes.bdate_rangepandas.core.indexes.datetimes.DatetimeIndex.stdpandas.core.indexes.timedeltas.TimedeltaIndex.meanpandas.core.resample.Resampler.asfreqpandas.core.resample.Resampler.quantilepandas.core.series.Series.mappandas.core.series.Series.tz_convertpandas.core.series.Series.tz_localizepandas.core.window.expanding.Expanding.countpandas.core.window.rolling.Rolling.countpandas.core.groupby.generic.DataFrameGroupBy.aggregatepandas.core.groupby.generic.SeriesGroupBy.aggregatepandas.core.frame.DataFrame.applymappandas.core.series.Series.applypandas.core.groupby.generic.DataFrameGroupBy.bfillpandas.core.groupby.generic.DataFrameGroupBy.ffillpandas.core.groupby.generic.SeriesGroupBy.bfillpandas.core.groupby.generic.SeriesGroupBy.ffillpandas.core.frame.DataFrame.backfillpandas.core.frame.DataFrame.bfillpandas.core.frame.DataFrame.comparepandas.core.frame.DataFrame.unstackpandas.core.frame.DataFrame.asfreqpandas.core.series.Series.backfillpandas.core.series.Series.bfillpandas.core.series.Series.comparepandas.core.series.Series.unstackpandas.core.series.Series.asfreqpandas.core.series.Series.argmaxpandas.core.series.Series.argminpandas.core.indexes.accessors.CombinedDatetimelikeProperties.microsecondpandas.core.indexes.accessors.CombinedDatetimelikeProperties.nanosecondpandas.core.indexes.accessors.CombinedDatetimelikeProperties.day_namepandas.core.indexes.accessors.CombinedDatetimelikeProperties.month_namepandas.core.indexes.accessors.CombinedDatetimelikeProperties.month_startpandas.core.indexes.accessors.CombinedDatetimelikeProperties.month_endpandas.core.indexes.accessors.CombinedDatetimelikeProperties.is_year_startpandas.core.indexes.accessors.CombinedDatetimelikeProperties.is_year_endpandas.core.indexes.accessors.CombinedDatetimelikeProperties.is_quarter_startpandas.core.indexes.accessors.CombinedDatetimelikeProperties.is_quarter_endpandas.core.indexes.accessors.CombinedDatetimelikeProperties.is_leap_yearpandas.core.indexes.accessors.CombinedDatetimelikeProperties.floorpandas.core.indexes.accessors.CombinedDatetimelikeProperties.ceilpandas.core.groupby.generic.DataFrameGroupBy.idxmaxpandas.core.groupby.generic.DataFrameGroupBy.idxminpandas.core.groupby.generic.DataFrameGroupBy.stdpandas.core.indexes.timedeltas.TimedeltaIndex.meanpandas.core.tools.timedeltas.to_timedelta
Bekanntes Problem¶
Diese Version enthält ein Problem bei der Konvertierung des Beispielprojekts, das in dieser Version nicht funktioniert. Es wird im nächsten Release behoben werden
Version 2.4.3 (9. Januar 2025)¶
Anwendung & CLI Version 2.4.3¶
Desktop-App¶
Link zur Fehlerbehebungsanleitung im Modalfenster für Absturzberichte hinzugefügt.
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 4.15.0
Hinzugefügt¶
Die folgenden PySpark-Elemente wurden der ConversionStatusPySpark.csv-Datei als
NotSupportedhinzugefügt:pyspark.sql.streaming.readwriter.DataStreamReader.tablepyspark.sql.streaming.readwriter.DataStreamReader.schemapyspark.sql.streaming.readwriter.DataStreamReader.optionspyspark.sql.streaming.readwriter.DataStreamReader.optionpyspark.sql.streaming.readwriter.DataStreamReader.loadpyspark.sql.streaming.readwriter.DataStreamReader.formatpyspark.sql.streaming.query.StreamingQuery.awaitTerminationpyspark.sql.streaming.readwriter.DataStreamWriter.partitionBypyspark.sql.streaming.readwriter.DataStreamWriter.toTablepyspark.sql.streaming.readwriter.DataStreamWriter.triggerpyspark.sql.streaming.readwriter.DataStreamWriter.queryNamepyspark.sql.streaming.readwriter.DataStreamWriter.outputModepyspark.sql.streaming.readwriter.DataStreamWriter.formatpyspark.sql.streaming.readwriter.DataStreamWriter.optionpyspark.sql.streaming.readwriter.DataStreamWriter.foreachBatchpyspark.sql.streaming.readwriter.DataStreamWriter.start
Geändert¶
Aktualisiertes Hive SQL EWIs-Format.
SPRKHVSQL1001
SPRKHVSQL1002
SPRKHVSQL1003
SPRKHVSQL1004
SPRKHVSQL1005
SPRKHVSQL1006
Aktualisiertes Spark SQL EWIs-Format.
SPRKSPSQL1001
SPRKSPSQL1002
SPRKSPSQL1003
SPRKSPSQL1004
SPRKSPSQL1005
SPRKSPSQL1006
Korrigiert¶
Es wurde ein Fehler korrigiert, der dazu geführt hat, dass einige PySpark-Elemente vom Tool nicht erkannt wurden.
Die Nichtübereinstimmung zwischen den in ThirdParty identifizierten Anrufen und der Anzahl der importierten ThirdParty Anrufe wurde korrigiert.
Version 2.4.2 (13. Dezember 2024)¶
Anwendung und CLI Version 2.4.2¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 4.14.0
Hinzugefügt added¶
Die folgenden Spark-Elemente wurden zu ConversionStatusPySpark.csv hinzugefügt:
pyspark.broadcast.Broadcast.valuepyspark.conf.SparkConf.getAllpyspark.conf.SparkConf.setAllpyspark.conf.SparkConf.setMasterpyspark.context.SparkContext.addFilepyspark.context.SparkContext.addPyFilepyspark.context.SparkContext.binaryFilespyspark.context.SparkContext.setSystemPropertypyspark.context.SparkContext.versionpyspark.files.SparkFilespyspark.files.SparkFiles.getpyspark.rdd.RDD.countpyspark.rdd.RDD.distinctpyspark.rdd.RDD.reduceByKeypyspark.rdd.RDD.saveAsTextFilepyspark.rdd.RDD.takepyspark.rdd.RDD.zipWithIndexpyspark.sql.context.SQLContext.udfpyspark.sql.types.StructType.simpleString
Geändert¶
Die Dokumentation der Pandas EWIs,
PNDSPY1001,PNDSPY1002undPNDSPY1003SPRKSCL1137wurde an ein standardisiertes Format angepasst, um Konsistenz und Klarheit für alle EWIs zu gewährleisten.Die Dokumentation der folgenden Scala EWIs wurde aktualisiert:
SPRKSCL1106undSPRKSCL1107. Zu erfolgende Anpassung an ein standardisiertes Format, um Konsistenz und Klarheit in allen EWIs zu gewährleisten.
Korrigiert¶
Es wurde ein Fehler korrigiert, der dazu geführt hat, dass die Symbole von UserDefined im Inventar der Drittanbieter-Nutzungen angezeigt wurden.
Version 2.4.1 (4. Dezember 2024)¶
Anwendung und CLI Version 2.4.1¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 4.13.1
Befehlszeilenschnittstelle¶
Geändert
Zeitstempel für den Ausgabeordner hinzugefügt.
Snowpark Conversion Core 4.13.1¶
Hinzugefügt¶
Spalte ‚Ausgangssprache‘ zur Tabelle der Bibliothekszuordnungen hinzugefügt
Andereals neue Kategorie in der Pandas API-Zusammenfassung-Tabelle der DetailedReport.docx-Datei hinzugefügt
Geändert¶
Die Dokumentation für Python EWI
SPRKPY1058wurde aktualisiert.Die Meldung für pandas EWI
PNDSPY1002wurde aktualisiert, um das relate pandas-Element anzuzeigen.Die Art und Weise, wie wir die .csv-Berichte erstellt haben, wurde aktualisiert und wird nun nach einem zweiten Durchlauf überschrieben.
Korrigiert¶
Es wurde ein Fehler korrigiert, der dazu geführt hat, dass Notebook-Dateien in der Ausgabe nicht erzeugt wurden.
Der Ersetzer für die Methoden
getundsetvonpyspark.sql.conf wurde korrigiert.RuntimeConfig, der Ersetzer entspricht nun den korrekten vollständigen Namen.Fehlerhafte Version des Abfrage-Tags wurde korrigiert.
Als ThirdPartyLib gemeldete UserDefined-Pakete wurden korrigiert.
\
Version 2.3.1 (14. November 2024)¶
Anwendung und CLI Version 2.3.1¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 4.12.0
Desktop-App¶
Korrigiert
Korrektur von Problemen mit der Groß- und Kleinschreibung in –sql Optionen.
Entfernt
Entfernen Sie den Plattformnamen aus der show-ac-Meldung.
Snowpark Conversion Core 4.12.0¶
Hinzugefügt¶
Unterstützung für Snowpark Python 1.23.0 und 1.24.0 wurde hinzugefügt.
Eine neue EWI für die
pyspark.sql.dataframe.DataFrame.writeTo-Funktion wurde hinzugefügt. Alle Verwendungen dieser Funktion verfügen nun über die EWI SPRKPY1087.
Geändert¶
Die Dokumentation der Scala EWIs wurde von
SPRKSCL1137aufSPRKSCL1156aktualisiert, um ein standardisiertes Format zu erhalten, das Konsistenz und Klarheit für alle EWIs gewährleistet.Die Dokumentation der Scala EWIs wurde von
SPRKSCL1117aufSPRKSCL1136aktualisiert, um ein standardisiertes Format zu erhalten, das Konsistenz und Klarheit für alle EWIs gewährleistet.Die Meldung, die für die folgende EWIs angezeigt wird, wurde aktualisiert:
SPRKPY1082
SPRKPY1083
Die Dokumentation der Scala EWIs wurde von
SPRKSCL1100aufSPRKSCL1105, vonSPRKSCL1108aufSPRKSCL1116; vonSPRKSCL1157aufSPRKSCL1175aktualisiert, um ein standardisiertes Format zu erhalten, das Konsistenz und Klarheit in allen EWIs gewährleistet.Der Zuordnungsstatus der folgenden PySpark-Elemente wurde von NotSupported auf Direkt mit EWI aktualisiert:
pyspark.sql.readwriter.DataFrameWriter.option=>snowflake.snowpark.DataFrameWriter.option: Alle Verwendungen dieser Funktion verfügen nun über die EWI SPRKPY1088pyspark.sql.readwriter.DataFrameWriter.options=>snowflake.snowpark.DataFrameWriter.options: Alle Verwendungen dieser Funktion verfügen nun über die EWI SPRKPY1089
Der Zuordnungsstatus der folgenden PySpark-Elemente wurde von Workaround auf Umbenennen aktualisiert:
pyspark.sql.readwriter.DataFrameWriter.partitionBy=>snowflake.snowpark.DataFrameWriter.partition_by
Aktualisierte EWI-Dokumentation: SPRKSCL1000, SPRKSCL1001, SPRKSCL1002, SPRKSCL1100, SPRKSCL1101, SPRKSCL1102, SPRKSCL1103, SPRKSCL1104, SPRKSCL1105.
Entfernt¶
Das
pyspark.sql.dataframe.DataFrameStatFunctions.writeTo-Element wurde aus dem Konvertierungsstatus entfernt, dieses Element existiert nicht.
Veraltet¶
Die folgenden EWI-Codes sind veraltet:
SPRKPY1081
SPRKPY1084
Version 2.3.0 (30. Oktober 2024)¶
Anwendung & CLI Version 2.3.0¶
Snowpark Conversion Core 4.11.0
Snowpark Conversion Core 4.11.0¶
Hinzugefügt¶
Der
Issues.csv-Datei wurde eine neue Spalte namensUrlhinzugefügt, die auf die entsprechende EWI Dokumentation weiterleitet.Neue EWIs für die folgenden Spark-Elemente wurden hinzugefügt:
[SPRKPY1082] pyspark.sql.readwriter.DataFrameReader.load
[SPRKPY1083] pyspark.sql.readwriter.DataFrameWriter.save
[SPRKPY1084] pyspark.sql.readwriter.DataFrameWriter.option
[SPRKPY1085] pyspark.ml.feature.VectorAssembler
[SPRKPY1086] pyspark.ml.linalg.VectorUDT
38 neue Pandas-Elemente wurden hinzugefügt:
pandas.core.frame.DataFrame.select
andas.core.frame.DataFrame.str
pandas.core.frame.DataFrame.str.replace
pandas.core.frame.DataFrame.str.upper
pandas.core.frame.DataFrame.to_list
pandas.core.frame.DataFrame.tolist
pandas.core.frame.DataFrame.unique
pandas.core.frame.DataFrame.values.tolist
pandas.core.frame.DataFrame.withColumn
pandas.core.groupby.generic._SeriesGroupByScalar
pandas.core.groupby.generic._SeriesGroupByScalar[S1].agg
pandas.core.groupby.generic._SeriesGroupByScalar[S1].aggregate
pandas.core.indexes.datetimes.DatetimeIndex.year
pandas.core.series.Series.columns
pandas.core.tools.datetimes.to_datetime.date
pandas.core.tools.datetimes.to_datetime.dt.strftime
pandas.core.tools.datetimes.to_datetime.strftime
pandas.io.parsers.readers.TextFileReader.apply
pandas.io.parsers.readers.TextFileReader.astype
pandas.io.parsers.readers.TextFileReader.columns
pandas.io.parsers.readers.TextFileReader.copy
pandas.io.parsers.readers.TextFileReader.drop
pandas.io.parsers.readers.TextFileReader.drop_duplicates
pandas.io.parsers.readers.TextFileReader.fillna
pandas.io.parsers.readers.TextFileReader.groupby
pandas.io.parsers.readers.TextFileReader.head
pandas.io.parsers.readers.TextFileReader.iloc
pandas.io.parsers.readers.TextFileReader.isin
pandas.io.parsers.readers.TextFileReader.iterrows
pandas.io.parsers.readers.TextFileReader.loc
pandas.io.parsers.readers.TextFileReader.merge
pandas.io.parsers.readers.TextFileReader.rename
pandas.io.parsers.readers.TextFileReader.shape
pandas.io.parsers.readers.TextFileReader.to_csv
pandas.io.parsers.readers.TextFileReader.to_excel
pandas.io.parsers.readers.TextFileReader.unique
pandas.io.parsers.readers.TextFileReader.values
pandas.tseries.offsets
Version 2.2.3 (24. Oktober 2024)¶
Anwendungsversion 2.2.3¶
Enthaltene SMA Core-Versionen¶
Snowpark Conversion Core 4.10.0
Desktop-App¶
Korrigiert¶
Es wurde ein Fehler korrigiert, der dazu führte, dass SMA in der Menüleiste der Windows-Version die Bezeichnung SnowConvert anstelle von Snowpark Migration Accelerator anzeigte.
Es wurde ein Fehler korrigiert, der zum Absturz von SMA führte, wenn das Programm keine Lese- und Schreibrechte für das Verzeichnis
.configin macOS und das VerzeichnisAppDatain Windows hatte.
Befehlszeilenschnittstelle¶
Geändert
Der Name der ausführbaren Datei CLI wurde von
snowctinsmaumbenannt.Das Argument für die Quellsprache wurde entfernt, so dass Sie nicht mehr angeben müssen, ob Sie eine Python- oder Scala-Bewertung/Konvertierung durchführen.
Die von CLI unterstützten Befehlszeilenargumente wurden um die folgenden neuen Argumente erweitert:
--enableJupyter|-j: Flagge, die angibt, ob die Konvertierung von Databricks-Notebooks in Jupyter aktiviert ist oder nicht.--sql|-f: Syntax der Datenbank-Engine, die verwendet werden soll, wenn ein SQL-Befehl erkannt wird.--customerEmail|-e: Konfigurieren der Kunden-E-Mail.--customerCompany|-c: Konfigurieren der Kundenfirma.--projectName|-p: Konfigurieren Sie das Kundenprojekt.
Einige Texte wurden aktualisiert, um den korrekten Namen der Anwendung wiederzugeben und die Konsistenz und Klarheit aller Meldungen zu gewährleisten.
Aktualisieren Sie die Nutzungsbedingungen der Anwendung.
Die Dokumentation von CLI wurde aktualisiert und erweitert, um die neuesten Features, Verbesserungen und Änderungen zu berücksichtigen.
Der Text, der vor der Ausführung von SMA angezeigt wird, wurde verbessert.
Das CLI wurde aktualisiert, sodass „Ja“ als gültiges Argument akzeptiert wird, wenn der Benutzer zur Bestätigung aufgefordert wird.
Ermöglicht es CLI, die Ausführung fortzusetzen, ohne auf eine Interaktion des Benutzers zu warten, indem Sie das Argument
-yoder--yesangeben.Die Hilfeinformationen für das Argument
--sqlwurden aktualisiert, um die Werte anzuzeigen, die dieses Argument erwartet.
Snowpark Conversion Core Version 4.10.0¶
Hinzugefügt¶
Eine neue EWI für die Funktion
pyspark.sql.readwriter.DataFrameWriter partitionBywurde hinzugefügt. Alle Verwendungen dieser Funktion verfügen nun über die EWI SPRKPY1081.Der Datei
ImportUsagesInventory.csvwurde eine neue Spalte namensTechnologiehinzugefügt.
Geändert¶
Die Bereitschaftsbewertung von Drittanbieter-Bibliotheken wurde aktualisiert, um auch die
UnbekanntenBibliotheken zu berücksichtigen.Die Datei
AssessmentFiles.zipwurde aktualisiert und enthält nun.json-Dateien anstelle von.pam-Dateien.Der Konvertierungsmechanismus von CSV zu JSON wurde verbessert, um die Verarbeitung von Beständen leistungsfähiger zu machen.
Die Dokumentation der folgenden EWIs wurde verbessert:
SPRKPY1029
SPRKPY1054
SPRKPY1055
SPRKPY1063
SPRKPY1075
SPRKPY1076
Der Zuordnungsstatus der folgenden Spark Scala-Elemente wurde von
DirektaufUmbenennenaktualisiert.org.apache.spark.sql.functions.shiftLeft=>com.snowflake.snowpark.functions.shiftleftorg.apache.spark.sql.functions.shiftRight=>com.snowflake.snowpark.functions.shiftright
Der Zuordnungsstatus der folgenden Spark Scala-Elemente wurde von
Nicht unterstützaufDirektaktualisiert.org.apache.spark.sql.functions.shiftleft=>com.snowflake.snowpark.functions.shiftleftorg.apache.spark.sql.functions.shiftright=>com.snowflake.snowpark.functions.shiftright
Korrigiert¶
Es wurde ein Fehler korrigiert, der dazu führte, dass SMA die Spalte
HerkunftderImportUsagesInventory. csv-Datei falsch befüllt hat.Es wurde ein Fehler korrigiert, der dazu führte, dass SMA-Importe der Bibliotheken
io,json,loggingundunittestin derImportUsagesInventory.csv-Datei und in derDetailedReport.docx-Datei nicht als Python built-in Importe klassifizierte.
Version 2.2.2 (11. Oktober 2024)¶
Anwendungsversion 2.2.2¶
Features-Updates umfassen:
Snowpark Conversion Core 4.8.0
Snowpark Conversion Core Version 4.8.0¶
Hinzugefügt¶
EwiCatalog.csvund .md-Dateien hinzugefügt, um die Dokumentation zu reorganisierenDer Zuordnungsstatus von
pyspark.sql.functions.lnDirect wurde hinzugefügt.Eine Transformation für
pyspark.context.SparkContext.getOrCreatewurde hinzugefügt.Weitere Einzelheiten finden Sie unter EWI SPRKPY1080.
Es wurde eine Verbesserung für SymbolTable hinzugefügt, um den Typ von Parametern in Funktionen zu ermitteln.
Hinzugefügte SymbolTable unterstützt statische Methoden und geht nicht davon aus, dass der erste Parameter bei diesen Methoden „self“ ist.
Eine Dokumentation für fehlende EWIs wurde hinzugefügt
SPRKHVSQL1005
SPRKHVSQL1006
SPRKSPSQL1005
SPRKSPSQL1006
SPRKSCL1002
SPRKSCL1170
SPRKSCL1171
SPRKPY1057
SPRKPY1058
SPRKPY1059
SPRKPY1060
SPRKPY1061
SPRKPY1064
SPRKPY1065
SPRKPY1066
SPRKPY1067
SPRKPY1069
SPRKPY1070
SPRKPY1077
SPRKPY1078
SPRKPY1079
SPRKPY1101
Geändert¶
Der Zuordnungsstatus wurde aktualisiert von:
pyspark.sql.functions.array_removevonNotSupportedzuDirekt.
Korrigiert¶
Die Tabelle „Code-Dateigröße“ im Detailbericht wurde korrigiert, um .sql- und .hql-Dateien auszuschließen, und die Zeile „Extra groß“ wurde zur Tabelle hinzugefügt.
Das Fehlen des
update_query_tagwurde korrigiert, wennSparkSessionin mehreren Zeilen aufPythondefiniert ist.Das Fehlen des
update_query_tagwurde korrigiert, wennSparkSessionin mehreren Zeilen aufScaladefiniert ist.Das Fehlen von EWI
SPRKHVSQL1001bei einigen SQL-Anweisungen mit Parsing-Fehlern wurde korrigiert.Feste Werte für neue Zeilen innerhalb von Zeichenfolgenliteralen korrigiert
Die Anzeige der Gesamtanzahl der Codezeilen in der Dateityp-Übersichtstabelle wurde korrigiert
Als 0 angezeigter Parsing-Score bei erfolgreich erkannten Dateien wurde korrigiert
LOC-Zählung im Zellenbestand für Databricks Magic SQL-Zellen wurde korrigiert
Version 2.2.0 (26. September 2024)¶
Anwendungsversion 2.2.0¶
Feature-Updates umfassen:
Snowpark Conversion Core 4.6.0
Snowpark Conversion Core Version 4.6.0¶
Hinzugefügt¶
Hinzufügen der Transformation für
pyspark.sql.readwriter.DataFrameReader.parquet.Hinzufügen der Transformation für
pyspark.sql.readwriter.DataFrameReader.option, wenn es sich um eine Parquet-Methode handelt.
Geändert¶
Der Zuordnungsstatus wurde aktualisiert von:
pyspark.sql.types.StructType.fieldsvonNotSupportednachDirekt.pyspark.sql.types.StructType.namesvonNotSupportednachDirekt.pyspark.context.SparkContext.setLogLevelvonWorkaroundzuTransformation.Weitere Einzelheiten finden Sie unter EWIs SPRKPY1078 und SPRKPY1079
org.apache.spark.sql.functions.roundvonWorkAroundzuDirekt.org.apache.spark.sql.functions.udfvonNotDefinedzuTransformation.Weitere Einzelheiten finden Sie unter EWIs SPRKSCL1174 und SPRKSCL1175
Der Zuordnungsstatus der folgenden Spark-Elemente wurde von
DirectHelperaufDirektaktualisiert:org.apache.spark.sql.functions.hexorg.apache.spark.sql.functions.unhexorg.apache.spark.sql.functions.shiftleftorg.apache.spark.sql.functions.shiftrightorg.apache.spark.sql.functions.reverseorg.apache.spark.sql.functions.isnullorg.apache.spark.sql.functions.unix_timestamporg.apache.spark.sql.functions.randnorg.apache.spark.sql.functions.signumorg.apache.spark.sql.functions.signorg.apache.spark.sql.functions.collect_listorg.apache.spark.sql.functions.log10org.apache.spark.sql.functions.log1porg.apache.spark.sql.functions.base64org.apache.spark.sql.functions.unbase64org.apache.spark.sql.functions.regexp_extractorg.apache.spark.sql.functions.exprorg.apache.spark.sql.functions.date_formatorg.apache.spark.sql.functions.descorg.apache.spark.sql.functions.ascorg.apache.spark.sql.functions.sizeorg.apache.spark.sql.functions.locateorg.apache.spark.sql.functions.ntile
Korrigiert¶
Der im Prozentsatz der gesamten Pandas Api angezeigte Wert wurde korrigiert
Gesamtprozentsatz auf ImportCalls in der DetailReport-Tabelle wurde korrigiert
Veraltet¶
Der folgende EWI-Code ist veraltet:
SPRKSCL1115
Version 2.1.7 (12. September 2024)¶
Anwendungsversion 2.1.7¶
Feature-Updates umfassen:
Snowpark Conversion Core 4.5.7
Snowpark Conversion Core 4.5.2
Snowpark Conversion Core Version 4.5.7¶
Fehlerbehebung per Hotfix¶
Die Gesamtzeile in den Spark-Nutzungsübersichten wurde hinzugefügt, wenn es keine Nutzungen gibt
Von Python Assembly auf Version=
1.3.111aktualisiertNachstehendes Komma in mehrzeiligen Argumenten parsen
Snowpark Conversion Core Version 4.5.2¶
Hinzugefügt¶
Transformation für
pyspark.sql.readwriter.DataFrameReader.optionwurde hinzugefügt:Wenn die Kette aus einem CSV-Methodenaufruf stammt.
Wenn die Kette aus einem JSON-Methodenaufruf stammt.
Transformation für
pyspark.sql.readwriter.DataFrameReader.jsonwurde hinzugefügt.
Geändert¶
Ausgeführt SMA auf SQL-Strings, die an Python/Scala-Funktionen übergeben werden
Erstellen Sie AST in Scala/Python, um eine temporäre SQL-Einheit auszugeben
Erstellen Sie einen SqlEmbeddedUsages.csv-Bestand
Verwerfen Sie SqlStatementsInventroy.csv und SqlExtractionInventory.csv
Integrieren Sie EWI, wenn das SQL-Literal nicht verarbeitet werden konnte
Erstellen Sie neue Aufgabe, um SQL-eingebetteten Code zu verarbeiten
Sammeln Sie Informationen für SqlEmbeddedUsages.csv-Bestand in Python
Ersetzen Sie mit SQL transformierten Code in Python durch Literal
Aktualisieren Sie Testfälle nach der Implementierung
Erstellen Sie eine Tabelle und Ansichten für Telemetrie in SqlEmbeddedUsages-Bestand
Sammeln Sie Informationen für SqlEmbeddedUsages.csv-Bericht in Scala
Ersetzen Sie SQL transformierten Code in Scala durch Literal
Prüfen Sie die Reihenfolge der Zeilennummern für die Berichterstattung von Embedded SQL
Füllen Sie die
SqlFunctionsInfo.csvmit den SQL-Funktionen, die für SparkSQL und HiveSQLDer Zuordnungsstatus wurde aktualisiert für:
org.apache.spark.sql.SparkSession. sparkContextvon NotSupported zu „Transformation“.org.apache.spark.sql.Builder.configvonNotSupportedzuTransformation. Mit diesem neuen Zuordnungsstatus wird die SMA alle Verwendungen dieser Funktion aus dem Quellcode entfernen.
Version 2.1.6 (5. September 2024)¶
Anwendungsversion 2.1.6¶
Hotfix-Änderung für Snowpark Engines Core Version 4.5.1
Spark Conversion Core Version 4.5.1¶
Hotfix
Es wurde ein Mechanismus zur Konvertierung der von SMA erzeugten temporalen Databricks-Notebooks in exportierte Databricks-Notebooks hinzugefügt
Version 2.1.5 (29. August 2024)¶
Anwendungsversion 2.1.5¶
Feature-Updates umfassen:
Aktualisierter Spark Conversion Core: 4.3.2
Spark Conversion Core Version 4.3.2¶
Hinzugefügt¶
Es wurde der Mechanismus hinzugefügt (über Dekoration), um die Zeile und Spalte der in Notizbuchzellen identifizierten Elemente abzurufen.
Ein EWI für pyspark.sql.functions.from_json wurde hinzugefügt.
Eine Transformation für pyspark.sql.readwriter.DataFrameReader.csv wurde hinzugefügt.
Aktiviert den Abfrage-Tag-Mechanismus für Scala-Dateien.
Der Analysis Score-Code und zusätzliche Links zum detaillierten Bericht wurden hinzugefügt.
InputFilesInventory.csv wurde eine Spalte namens OriginFilePath hinzugefügt
Geändert¶
Der Zuordnungsstatus von pyspark.sql.functions.from_json wurde von „Nicht unterstützt“ auf „Transformation“ aktualisiert.
Der Zuordnungsstatus der folgenden Spark-Elemente wurde von „Workaround“ auf „Direkt“ aktualisiert:
org.apache.spark.sql.functions.countDistinct
org.apache.spark.sql.functions.max
org.apache.spark.sql.functions.min
org.apache.spark.sql.functions.mean
Veraltet¶
Die folgenden EWI-Codes sind veraltet:
SPRKSCL1135
SPRKSCL1136
SPRKSCL1153
SPRKSCL1155
Korrigiert¶
Es wurde ein Fehler korrigiert, der zu einer falschen Berechnung des Spark API-Ergebnisses führte.
Ein Fehler wurde korrigiert, der das Kopieren von SQL leeren oder kommentierten Dateien im Ausgabeordner verhinderte.
Es wurde ein Fehler in DetailedReport korrigiert. Die Notebook-Statistiken LOC und die Zellenzahl sind nicht korrekt.
Version 2.1.2 (14. August 2024)¶
Anwendungsversion 2.1.2¶
Feature-Updates umfassen:
Aktualisierter Spark Conversion Core: 4.2.0
Spark Conversion Core Version 4.2.0¶
Hinzugefügt¶
Hinzufügen einer Technologie-Spalte zu SparkUsagesInventory
Ein EWI für nicht definierte SQL-Elemente wurde hinzugefügt.
SqlFunctions-Inventar hinzugefügt
Sammeln Sie Informationen für SqlFunctions-Inventar
Geändert¶
Die Engine verarbeitet und druckt jetzt teilweise geparste Python-Dateien, anstatt die Originaldatei unverändert zu lassen.
Python-Notebook-Zellen, die Parsing-Fehler aufweisen, werden ebenfalls verarbeitet und gedruckt.
Korrigiert¶
pandas.core.indexes.datetimes.DatetimeIndex.strftime, das fälschlicherweise gemeldet wurde, wurde korrigiert.Korrektur der Diskrepanz zwischen SQL-Bereitschaftsbewertung und SQL-Verwendungen nach Unterstützungsstatus.
Es wurde ein Fehler korrigiert, der dazu führte, dass SMA
pandas.core.series.Series.emptymit einem falschen Zuordnungsstatus meldete.Korrektur der Diskrepanz zwischen Spark API-Verwendungen bereit zur Konvertierung in DetailedReport.docx unterscheidet sich von UsagesReadyForConversion-Zeile in Assessment.json.
Version 2.1.1 (8. August 2024)¶
Anwendungsversion 2.1.1¶
Feature-Updates umfassen:
Aktualisierter Spark Conversion Core: 4.1.0
Spark Conversion Core Version 4.1.0¶
Hinzugefügt¶
Die folgenden Informationen wurden der Datei
AssessmentReport.jsonhinzugefügtDie Bereitschaftsbewertung von Bibliotheken von Drittanbietern.
Die Anzahl der Aufrufe von Bibliotheken von Drittanbietern, die identifiziert wurden.
Die Anzahl der Aufrufe von Bibliotheken von Drittanbietern, die in Snowpark unterstützt werden.
Der Farbcode, der mit der Bereitschaftsbewertung von Drittanbietern, der Bereitschaftsbewertung von Spark API und der Bereitschaftsbewertung von SQL verbunden ist.
Transformierte
SqlSimpleDataTypein Spark erstelle Tabellen.Die Zuordnung von
pyspark.sql.functions.getwurde als „direkt“ hinzugefügt.Die Zuordnung von
pyspark.sql.functions.to_varcharwurde als „direkt“ hinzugefügt.Im Rahmen der Änderungen nach der Vereinheitlichung erzeugt das Tool nun eine Ausführungsinformationsdatei in der Engine.
Ein Ersetzer für
pyspark.sql.SparkSession.builder.appNamewurde hinzugefügt.
Geändert¶
Der Zuordnungsstatus wurde für die folgenden Spark-Elemente aktualisiert
Von Zuordnung „Nicht unterstützt“ zu „Direkt“:
pyspark.sql.functions.signpyspark.sql.functions.signum
Der Bericht „Bestandsaufnahme der Notebook-Zellen“ wurde geändert, um die Art des Inhalts für jede Zelle in der Element-Spalte anzuzeigen
Es wurde eine Spalte
SCALA_READINESS_SCOREhinzugefügt, die die Bereitschaftsbewertung nur in Bezug auf Verweise auf die Spark API in Scala-Dateien anzeigt.Teilweise Unterstützung für die Transformation von Tabelleneigenschaften in
ALTER TABLEundALTER VIEWAktualisierung des Konvertierungsstatus des Knotens
SqlSimpleDataTypevon „Ausstehend“ auf „Transformation“ in Spark erstellten TabellenDie von SMA unterstützte Version von Snowpark Scala API wurde von
1.7.0auf1.12.1aktualisiert:Der Zuordnungsstatus wurde aktualisiert von:
org.apache.spark.sql.SparkSession.getOrCreatevon „Umbenennen“ zu „Direkt“org.apache.spark.sql.functions.sumvon „Workaround“ zu „Direkt“
Die von SMA unterstützte Version von Snowpark Python API wurde von
1.15.0auf1.20.0aktualisiert:Der Zuordnungsstatus wurde aktualisiert von:
pyspark.sql.functions.arrays_zipvon „Nicht unterstützt“ zu „Direkt“
Der Zuordnungsstatus wurde für die folgenden Pandas-Elemente aktualisiert:
Direkte Zuordnungen:
pandas.core.frame.DataFrame.anypandas.core.frame.DataFrame.applymap
Der Zuordnungsstatus wurde für die folgenden Pandas-Elemente aktualisiert:
Von Zuordnung „Nicht unterstützt“ zu „Direkt“:
pandas.core.frame.DataFrame.groupbypandas.core.frame.DataFrame.indexpandas.core.frame.DataFrame.Tpandas.core.frame.DataFrame.to_dict
Zuordnung von „Nicht unterstützt“ zu „Umbenennen“:
pandas.core.frame.DataFrame.map
Der Zuordnungsstatus wurde für die folgenden Pandas-Elemente aktualisiert:
Direkte Zuordnungen:
pandas.core.frame.DataFrame.wherepandas.core.groupby.generic.SeriesGroupBy.aggpandas.core.groupby.generic.SeriesGroupBy.aggregatepandas.core.groupby.generic.DataFrameGroupBy.aggpandas.core.groupby.generic.DataFrameGroupBy.aggregatepandas.core.groupby.generic.DataFrameGroupBy.apply
Nicht unterstützte Zuordnungen:
pandas.core.frame.DataFrame.to_parquetpandas.core.generic.NDFrame.to_csvpandas.core.generic.NDFrame.to_excelpandas.core.generic.NDFrame.to_sql
Der Zuordnungsstatus wurde für die folgenden Pandas-Elemente aktualisiert:
Direkte Zuordnungen:
pandas.core.series.Series.emptypandas.core.series.Series.applypandas.core.reshape.tile.qcut
Direkte Zuordnungen mit EWI:
pandas.core.series.Series.fillnapandas.core.series.Series.astypepandas.core.reshape.melt.meltpandas.core.reshape.tile.cutpandas.core.reshape.pivot.pivot_table
Der Zuordnungsstatus wurde für die folgenden Pandas-Elemente aktualisiert:
Direkte Zuordnungen:
pandas.core.series.Series.dtpandas.core.series.Series.groupbypandas.core.series.Series.locpandas.core.series.Series.shapepandas.core.tools.datetimes.to_datetimepandas.io.excel._base.ExcelFile
Nicht unterstützte Zuordnungen:
pandas.core.series.Series.dt.strftime
Der Zuordnungsstatus wurde für die folgenden Pandas-Elemente aktualisiert:
Von Zuordnung „Nicht unterstützt“ zu „Direkt“:
pandas.io.parquet.read_parquetpandas.io.parsers.readers.read_csv
Der Zuordnungsstatus wurde für die folgenden Pandas-Elemente aktualisiert:
Von Zuordnung „Nicht unterstützt“ zu „Direkt“:
pandas.io.pickle.read_picklepandas.io.sql.read_sqlpandas.io.sql.read_sql_query
Die Beschreibung von „Understanding the SQL Readiness Score“ wurde aktualisiert.
PyProgramCollectorwurde aktualisiert, um die Pakete zu sammeln und das aktuelle Paketinventar mit Daten aus dem Python-Quellcode aufzufüllen.Der Zuordnungsstatus von
pyspark.sql.SparkSession.builder.appNamewurde von „Umbenennen“ auf „Transformation“ aktualisiert.Die folgenden Scala-Integrationstests wurden entfernt:
AssesmentReportTest_AssessmentMode.ValidateReports_AssessmentModeAssessmentReportTest_PythonAndScala_Files.ValidateReports_PythonAndScalaAssessmentReportTestWithoutSparkUsages.ValidateReports_WithoutSparkUsages
Der Zuordnungsstatus von
pandas.core.generic.NDFrame.shapewurde von „Nicht unterstützt“ auf „Direkt“ aktualisiert.Der Zuordnungsstatus von
pandas.core.serieswurde von „Nicht unterstützt“ auf „Direkt“ aktualisiert.
Veraltet¶
Der Code EWI
SPRKSCL1160ist veraltet, daorg.apache.spark.sql.functions.sumjetzt eine direkte Zuordnung ist.
Korrigiert¶
Ein Fehler wurde korrigiert, indem Custom Magics ohne Argumente in Jupyter Notebook-Zellen nicht unterstützt werden.
Fehlerhafte Generierung von EWIs im Bericht issues.csv bei Parsing-Fehlern wurde korrigiert.
Es wurde ein Fehler korrigiert, der dazu führte, dass SMA das exportierte Databricks-Notizbuch nicht als Databricks-Notizbuch verarbeiten konnte.
Es wurde ein Stapelüberlauffehler bei der Verarbeitung kollidierender Typnamen von Deklarationen korrigiert, die innerhalb von Paketobjekten erstellt wurden.
Die Verarbeitung von komplexen Lambda-Typ-Namen, die Generika beinhalten, wurde korrigiert, z. B.
def func [X,Y](f: (Map[Option[X], Y] => Map[Y, X]))...Es wurde ein Fehler korrigiert, der dazu führte, dass SMA den Pandas-Elementen, die noch nicht erkannt werden, einen PySpark EWI Code anstelle eines Pandas EWI-Codes hinzufügte.
Tippfehler in der detaillierten Berichtsvorlage wurde korrigiert: Umbenennung einer Spalte von „Prozentsatz aller Python-Dateien„ in „Prozentsatz aller Dateien“.
Ein Fehler wurde korrigiert, bei dem
pandas.core.series.Series.shapefälschlicherweise gemeldet wurde.