Snowpark Migration Accelerator: SMA CLI 워크스루

Snowpark Migration Accelerator(SMA)는 개발자가 Python 또는 Scala Spark 코드를 Snowpark로 마이그레이션하는 데 도움을 줍니다. 코드를 분석하고:

  1. Snowpark와의 호환성 평가

  2. 호환되는 Spark API 호출을 Snowpark API 로 자동 변환합니다

  3. 자동으로 변환할 수 없는 코드를 식별합니다

  4. 스크립트 및 노트북에서 서드 파티 라이브러리 가져오기 인벤토리를 만듭니다

  5. Spark와 Snowpark 코드를 비교하는 편집 가능한 호환성 보고서를 생성합니다

Snowflake는 Snowpark Migration Accelerator(SMA)를 위한 명령줄 인터페이스(CLI)를 릴리스했습니다. 이 가이드에서는 CLI 를 독립형 도구로 사용하는 방법과 스크립트 내에서 사용하는 방법을 설명합니다.

CLI 사용하기

명령줄 인터페이스(CLI)는 다운로드 및 액세스 섹션에서 다운로드할 수 있습니다. 사용 중인 작업 시스템에 맞는 버전을 선택합니다. CLI 를 머신 또는 컨테이너의 접근 가능한 위치에 저장할 수 있습니다.

참고

참고: 이 안내에서는 Mac 컴퓨터의 스크린샷을 사용하지만, Windows 및 Linux 사용자도 프로세스는 유사합니다.

패키지 파일(.zip 또는 .tar 형식)을 다운로드한 후 해당 내용을 압축 해제합니다. 명령줄 인터페이스(CLI) 도구는 압축을 푼 파일 내의 “orchestrator” 폴더에 위치합니다.

오케스트레이터 디렉터리의 SMA CLI

설치 폴더에서 터미널 또는 명령 프롬프트를 열고 다음 명령을 실행하여 CLI 설치를 확인하여 버전을 확인합니다.

./sma –version

다음과 같은 결과가 표시됩니다.

SMA 버전 정보

SMA 명령줄 인터페이스(CLI)는 컴퓨터에서 실행되는 로컬 애플리케이션으로, SMA 데스크탑 애플리케이션과 유사합니다. SMA CLI 를 사용하여 코드 파일을 분석하려면 이러한 파일이 CLI 가 액세스할 수 있는 로컬 컴퓨터에 저장되어 있어야 합니다. CLI 는 일반 SMA 애플리케이션과 동일한 파일 유형을 지원합니다. 지원되는 파일 형식의 전체 목록은 SMA 설명서의 지원되는 파일 형식을 참조하십시오.

참고

참고: CLI 기능을 테스트하려면 평가 섹션에서 제공되는 샘플 코드베이스를 사용하거나 SMA 설명서의 변환 연습을 참조할 수 있습니다.

CLI 인자의 전체 목록은 SMA 설명서에 포함되어 있습니다. 이 섹션에서 가장 중요한 내용을 살펴 보겠습니다.

SMA CLI 는 기본적으로 평가 모드가 아닌 변환 모드에서 실행됩니다. 평가 모드에서 CLI 를 실행하려면 -a 인자를 사용합니다. 변환 작업을 하려면 유효한 액세스 코드가 필요합니다. 유효한 액세스 코드가 있는지 확인하려면 다음 명령을 사용하십시오.

./sma show-ac
Copy

라이선스 정보

액세스 코드가 필요한 경우 SMA 설명서의 지침에 따라 요청할 수 있습니다. 이메일로 코드를 받은 후 CLI 의 설치 액세스 코드 매개 변수를 사용하여 설치를 완료합니다.

변환을 실행하려면 공급자가 제공해야 합니다.

  1. 입력 디렉터리(필수)

  2. 출력 디렉터리(필수)

이전에 프로젝트 파일을 생성하지 않았다면 이 파일도 제공해야 합니다.

  • 사용자 이메일

  • 조직 이름

  • 프로젝트 이름

이러한 매개 변수를 처음 설정한 후에는 향후 변환을 위해 입력 및 출력 디렉터리만 지정하면 됩니다.

./sma -i '/your/INput/directory/path/here' -o '/your/OUTput/directory/path/here' -e your@email.com -c Your-Organization -p Your-Project-Name
Copy

이 화면에는 실행 설정 요약이 표시되고 계속할지 여부를 확인하는 메시지가 표시됩니다.

프로젝트 정보 섹션

확인 메시지를 건너뛰려면 –yes 또는 -y 매개 변수를 추가합니다. 이는 자동화된 스크립트에서 CLI 를 실행할 때 특히 중요합니다.

이 도구는 실행 중 자세한 진행 정보를 제공합니다.

프로젝트 정보 인쇄

도구가 실행되는 동안에는 계속 화면에 출력을 인쇄합니다. 프로세스가 완료되면 프롬프트가 다시 표시됩니다. 이 도구는 모든 프로세스, 문제, 완료 또는 실패한 단계가 포함된 상세한 출력을 생성합니다. 이 정보는 나중에 로그 출력 폴더에서 검토할 수 있으므로 실행 중일 때 이 정보를 모두 읽을 필요는 없습니다.

출력 보기

SMA CLI 는 SMA 애플리케이션과 동일한 출력을 생성합니다. 도구를 실행하면 지정된 출력 디렉터리에 3개의 폴더가 생성됩니다.

SMA 의 출력 디렉터리

Snowpark Migration Accelerator(SMA)를 통해 변환된 코드 작업에 대한 자세한 지침은 변환 연습을 참조하십시오.

프로그래밍 방식으로 CLI 실행

곧 출시됩니다! SMA 팀에서 SMA 명령줄 인터페이스(CLI)를 여러 디렉터리에서 자동으로 실행할 수 있는 스크립트를 제공합니다.


지금 바로 명령줄 인터페이스(CLI)를 사용해 보십시오. 도움이 필요하거나 궁금한 점이 있으면 Snowpark Migration Accelerator 팀(sma-support@Snowflake.com)으로 문의하십시오.