Snowpark Migration Accelerator: 코드 추출¶
Snowpark Migration Accelerator(SMA)는 지정된 디렉터리 내의 모든 파일을 처리합니다. 모든 파일의 인벤토리를 생성하지만, 특히 특정 확장자를 가진 파일을 분석하여 Spark API 참조를 식별합니다.
이 디렉터리에 파일을 추가하는 방법에는 여러 가지가 있습니다.
마이그레이션을 진행하기 전에 모든 관련 코드 파일을 1개의 디렉터리에 배치하십시오.
기존 환경(예:Databricks)에서 노트북을 추출하려면 추출 스크립트를 사용해 마이그레이션 프로세스를 지원할 수 있습니다.
추출 스크립트¶
Snowflake provides publicly available extraction scripts that you can find on the Snowflake Labs GitHub page. For Spark migrations, these scripts support various platforms.
Databricks¶
For Jupyter (.ipynb) or Databricks (.dbc) notebooks that run in Databricks, you can directly place them in a directory for SMA analysis without any extraction. To learn how to export your Databricks notebook files, visit the Databricks documentation here: https://docs.databricks.com/en/notebooks/notebook-export-import.html#export-notebooks.
For an alternative approach, you can follow the instructions and use the scripts available in the Databricks folder of the SC.DDLExportScripts repository: https://github.com/Snowflake-Labs/SC.DDLExportScripts/tree/main/Databricks
데이터 추출에 대한 추가 정보는 곧 제공될 예정입니다.