Snowpark Migration Accelerator: Interactive Assessment Application 설치 가이드

이 섹션에서는 Interactive Assessment Application(IAA)을 Snowflake 계정에 배포하는 방법을 안내합니다. IAA는 Snowflake 내에서 Snowflake의 강력한 기능을 활용하여 Snowpark Migration Accelerator(SMA)의 출력 데이터를 분석하는 Streamlit 앱입니다. 이 문서에서는 IAA를 사용하여 Snowflake 환경 내에서 워크로드를 분석하는 데 필요한 단계와 리소스를 알아봅니다.

단계별 가이드

IAA를 배포하기 전에 다음 전제 조건을 충족하는지 확인합니다.

  • SMA를 실행하여 출력 데이터를 분석할 준비가 되었습니다.

  • Snowflake 계정이 있습니다. (IAA를 호스팅하고 실행하는 데 필요합니다.) 계정이 없는 경우 Snowflake 평가판 계정이 사용됩니다.

  • 노트북을 실행할 수 있는 VSCode 또는 Jupyter가 설치되어 있습니다. VSCode 또는 Jupyter.

  • Python 3.11 이상이 설치되어 있습니다. 이 버전은 IAA 노트북과의 호환성을 위해 필요합니다.

    • 시스템에 Python이 이미 설치되어 있을 수 있습니다. 그렇지 않은 경우 아래 옵션 중 하나를 따릅니다.

모든 매핑 테이블을 업로드하는 데는 최신 매핑 테이블만 선택하는 것보다 시간이 더 오래 걸릴 수 있습니다. 실행 결과를 이전 버전과 비교하는 데 관심이 없다면 최신 테이블만 업로드하는 것이 좋습니다.

VS Code에서 APIs 및 EWIs 버전이 있는 모든 폴더가 포함된 Map 폴더를 선택하고 업로드하지 않을 폴더는 삭제할 수 있습니다. 이 경우에는 7.1.2 버전만 남겨두면 됩니다.

업로드할 수 있는 매핑

전제 조건 확인을 완료했으면 배포를 진행합니다.

IAA 배포하기!

참고

이 단계별 가이드는 VS Code에 적용됩니다

리포지토리

  1. Snowflake Labs의 오픈 소스 GitHub로 이동합니다. https://github.com/Snowflake-Labs/IAA-Support.

  2. “Code” 버튼을 클릭하고 원하는 리포지토리 복제 방법(예: HTTPS 또는 SSH)을 복사합니다.

  3. 로컬 컴퓨터에 리포지토리를 저장할 디렉터리를 선택합니다(해당되는 경우).

VS Code에서 노트북 실행

참고

참고: 이 배포 프로세스에서는 Snowflake CLI를 사용합니다.

  1. VSCode 환경에서 다운로드한 리포지토리를 엽니다.

  2. VS Code에서 Yes, I trust the authors를 클릭합니다.

iaa_config.toml 파일

파트 1: “Connect a tool to Snowflake”에서 자격 증명 가져오기

  1. Snowflake 계정에서 왼쪽 하단에 있는 이니셜을 클릭합니다.

  2. “Connect a tool to Snowflake”를 선택합니다.

  3. iaa\_config.toml 파일을 엽니다.

  4. “Connect a tool to Snowflake” 창에서 다음 정보를 복사하여 `iaa_config.toml` 파일에 붙여넣습니다.

    1. 계정 식별자

    2. 사용자 이름

파트 2: 추가 세부 정보 제공하기

`iaa_config.toml` 파일에 다음 정보도 제공합니다.

  1. 비밀번호: Snowflake 비밀번호를 입력합니다.

  2. 데이터베이스 이름: IAA에 사용할 데이터베이스의 이름을 입력합니다.

  3. 스키마 이름: IAA에 사용할 스키마의 이름을 입력합니다.

  4. 웨어하우스 이름: Snowflake 계정에서 실행 중인 웨어하우스의 이름을 입력합니다.

`iaa_config.toml` 파일에 변경 사항을 저장합니다.

경고

경고: .toml 정보가 잘못된 경우 연결 항목의 유효성을 검사하는 셀에 오류가 발생할 수 있습니다. 이 경우 입력 정보를 확인합니다.

커널

.ipynb 파일을 실행하려면 VS Code에 Python 및 Jupyter 확장 프로그램을 설치해야 합니다.

  1. 노트북 실행에 필요한 버전에 부합하는 Python 환경을 선택합니다. (3.11 이상).

노트북 실행

Snowflake 계정에 앱을 배포하려면 “Run all”을 선택합니다.

셀을 실행하면 로컬 환경을 자동으로 구성하고 Snowflake 계정 연결을 수립하여 Streamlit 앱 배포를 준비합니다. 특히 해당 셀은 다음을 수행합니다.

  1. Python3.11 요구 사항 확인

  2. Snowflake CLI 요구 사항 확인

  3. iaa_config.toml 파일을 실행하여 Snowflake 계정 구성에 연결:

    1. 로컬 .toml 파일 읽기

    2. 연결 항목 유효성 검사

    3. Snowflake 연결 수립

  4. Snowflake에 Streamlit 앱을 배포할 수 있는 환경 준비

    1. 로컬 환경 구성

    2. 연결 항목 검색

  5. Snowflake CLI를 사용하여 Streamlit 앱을 Snowflake에 배포:

    1. SiS에 앱 스키마 배포.

    2. SiS에 매핑 스테이지 배포.

    3. SiS에 APP 배포.

    4. 배포 새로 고침

    5. 앱 정보 검색 및 액세스 버튼 제공.

    이게 다입니다. 이제 출력을 업로드할 차례입니다.

SMA 출력 업로드하기!

출력 폴더에서 ‘AssessmentFiles_*.zip’ 형식의 SMA 출력 zip 파일을 찾습니다.

  1. Snowflake 계정으로 이동합니다

Data > Databases > [Your IAA Database] > Stages > SMA_EXECUTIONS
Copy

Snowflake 계정의 SMA_EXECUTIONS 스테이지.

  1. AssessmentFiles.zip을. 업로드합니다.

SMA_EXECUTIONS 스테이지로 SMA 출력 업로드

  1. IAA를 열어 실행 정보를 탐색합니다. 이 단계에는 약 30초가 걸릴 수 있습니다.

IAA

  1. IAA를 열면 랜딩 페이지가 다음과 같이 표시됩니다.

IAA 랜딩 페이지

이제 IAA를 사용하여 실행을 탐색할 수 있습니다.

IAA 살펴보기

이제 Interactive Assessment Application(IAA)이 Snowflake 계정에 설치됩니다. SMA 출력 실행을 성공적으로 업로드했으며, Spark 코드 및 Snowpark의 호환성을 살펴볼 준비가 되었습니다.

참고

Snowflake 계정에서 IAA에 액세스하는 방법을 기억하세요.

프로젝트 > Streamlit > Interactive Assessment Application

IAA를 사용하면 코드와 직접 호환되는 부분 및 수동 개입 또는 추가 최적화가 필요한 부분을 식별할 수 있습니다. 최신 SMA 버전을 사용하는 것이 좋습니다. 그러나 이전 실행이 있는 경우 IAA는 최신 API 매핑 버전과 비교합니다.