Snowpark Migration Accelerator: 워크스루 설정¶
이 가이드는 Snowpark Migration Accelerator(SMA)에 대한 실제 경험을 제공합니다. 실제 예제를 통해 코드를 평가하고 평가 결과를 해석하는 방법을 배우면서 도구의 기능을 명확하게 이해할 수 있습니다.
자료¶
이 자습서를 완료하려면 다음이 필요합니다.
Snowpark Migration Accelerator (SMA) 소프트웨어가 설치된 컴퓨터
동일한 컴퓨터에서 샘플 코드 파일에 액세스하기
시작하려면 컴퓨터에 두 가지 항목이 필요합니다.
Snowpark Migration Accelerator (SMA) 도구
코드 샘플
이러한 필수 리소스를 얻는 방법을 살펴보십시오.
SMA 애플리케이션¶
Snowpark Migration Accelerator(SMA)는 개발자가 PySpark 및 Spark Scala 애플리케이션을 Snowflake에서 실행하도록 변환하는 데 도움을 줍니다. Python 또는 Scala 코드에서 Spark API 호출을 자동으로 감지하고 이를 동등한 Snowpark API 호출로 변환합니다. 이 가이드에서는 샘플 Spark 코드를 분석하고 마이그레이션 프로젝트를 지원하는 방법을 보여줌으로써 기본적인 SMA 기능을 시연합니다.
초기 평가 단계에서 Snowpark Migration Accelerator(SMA)는 소스 코드를 검사하고 코드의 모든 기능을 캡처하는 세부 모델을 구축합니다. 이 분석을 기반으로 SMA 는 이 가이드에서 검토할 세부 평가 보고서를 포함한 여러 보고서를 작성합니다. 이러한 보고서를 통해 코드를 Snowpark로 마이그레이션할 준비가 얼마나 되었는지 파악하고 변환에 필요한 노력을 추정할 수 있습니다. 이 실험을 계속 진행하면서 이러한 결과에 대해 더 자세히 살펴보겠습니다.
다운로드 및 설치¶
Snowpark Migration Accelerator(SMA)로 평가를 시작하려면 설치 프로세스만 완료하면 됩니다. Snowflake는 SMA 사용을 위한 유용한 교육 을 옵션으로 제공하지만, 사용자는 이 교육을 받지 않아도 진행할 수 있습니다. 특별한 액세스 코드가 필요하지 않습니다. 단순히:
다운로드 및 액세스 섹션으로 이동하십시오.
설치 지침을 참조하여 컴퓨터에 애플리케이션을 설정합니다.
샘플 코드베이스¶
이 가이드에서는 Python 코드 예제를 사용하여 마이그레이션 프로세스를 설명합니다. 편견 없는 실제 사례로 서드 파티 Git 리포지토리에서 공개적으로 사용 가능한 샘플 코드베이스 2개를 선택했습니다. 이러한 코드베이스는 다음에서 액세스할 수 있습니다.
PySpark 데이터 엔지니어링 예시: https: https://github.com/spark-examples/pyspark-examples
Apache Spark 머신 러닝 예제: https://github.com/apache/spark/tree/master/examples/src/main/python
Snowpark Migration Accelerator(SMA)를 사용하여 코드베이스를 분석하려면 다음 단계를 따르십시오.
GitHub 에서 코드베이스를 zip 파일로 다운로드합니다. 이 작업에 대한 지침은 GitHub 설명서 를 참조하십시오.
컴퓨터에 각 코드베이스에 대해 별도의 폴더를 생성합니다.
아래 이미지와 같이 각 zip 파일을 지정된 폴더에 압축을 풉니다.
이 샘플 코드베이스는 SMA 가 Spark API 참조를 평가하여 Spark API 준비도 점수를 계산하는 방법을 보여 줍니다. 두 가지 시나리오를 살펴보겠습니다.
높은 점수를 받은 코드베이스로, Snowpark와 호환성이 높고 마이그레이션 준비가 완료되었음을 나타냅니다
낮은 점수를 받은 코드베이스로, 마이그레이션 전에 추가 검토 및 잠재적 수정이 필요함을 나타냅니다
준비도 점수는 귀중한 인사이트를 제공하지만, 마이그레이션을 계획할 때 고려해야 할 유일한 요소는 아닙니다. 성공적인 마이그레이션을 위해서는 고득점 평가와 저득점 평가 모두 모든 측면에 대한 종합적인 평가가 필요합니다.
디렉터리 압축을 푼 후 SMA 는 지원되는 코드 형식과 노트북 형식을 사용하는 파일만 분석합니다. 이 파일은 Spark API 및 기타 서드 파티 APIs 에 대한 참조 여부를 확인합니다. 지원되는 파일 유형을 확인하려면 목록 여기를 참조하십시오.
이 글의 나머지 부분에서는 이 두 코드베이스가 어떻게 실행되는지 분석해 보겠습니다.
지원¶
설치에 대한 도움이 필요하거나 코드에 액세스하려면 sma-support@Snowflake.com 으로 이메일을 보내주십시오.
코드베이스를 다운로드한 후 별도의 디렉터리에 압축을 풀면 됩니다.
도구 실행하기로 이동합니다
코드 준비 참고 사항 을 검토합니다.