Snowpark Migration Accelerator: 코드 추출

Snowpark Migration Accelerator(SMA)는 지정된 디렉터리 내의 모든 파일을 처리합니다. 모든 파일의 인벤토리를 생성하지만, 특히 특정 확장자를 가진 파일을 분석하여 Spark API 참조를 식별합니다.

이 디렉터리에 파일을 추가하는 방법에는 여러 가지가 있습니다.

마이그레이션을 진행하기 전에 모든 관련 코드 파일을 1개의 디렉터리에 배치하십시오.

기존 환경(예: Databricks)에서 노트북을 추출하려면 추출 스크립트를 사용해 마이그레이션 프로세스를 지원할 수 있습니다.

추출 스크립트

Snowflake는 공개적으로 사용 가능한 추출 스크립트를 제공하며, Snowflake Labs GitHub 페이지 에서 찾을 수 있습니다. Spark 마이그레이션의 경우 이러한 스크립트는 다양한 플랫폼을 지원합니다.

Databricks

Databricks에서 실행되는 Jupyter(.ipynb) 또는 Databricks(.dbc) 노트북의 경우, 추출 없이 SMA 분석을 위해 디렉터리에 직접 배치할 수 있습니다. Databricks 노트북 파일을 내보내는 방법을 알아보려면 여기 https://docs.databricks.com/en/notebooks/notebook-export-import.html#export-notebooks 의 Databricks 설명서를 참조하십시오.

다른 접근법의 경우, 지침에 따라 SC.DDLExportScripts 리포지토리의 Databricks 폴더(https://github.com/Snowflake-Labs/SC.DDLExportScripts/tree/main/Databricks)에 있는 스크립트를 사용할 수 있습니다.

데이터 추출에 대한 추가 정보는 곧 제공될 예정입니다.