Snowflake Notebooks 정보

Snowflake Notebooks 는 Python 및 SQL용 대화형 셀 기반 프로그래밍 환경을 제공하는 Snowsight의 개발 인터페이스입니다. Snowflake Notebooks 에서는 탐색적 데이터 분석을 수행하고, 머신 러닝 모델을 개발하고, 기타 데이터 과학 및 데이터 엔지니어링 작업을 모두 한곳에서 수행할 수 있습니다.

  • 이미 Snowflake에 있는 데이터를 탐색하고 실험하거나 로컬 파일, 외부 클라우드 저장소 또는 Snowflake Marketplace 의 데이터 세트에서 새 데이터를 Snowflake에 업로드할 수 있습니다.

  • SQL 또는 Python 코드를 작성하고 셀 단위로 개발 및 실행하여 결과를 빠르게 비교할 수 있습니다.

  • Streamlit 시각화와 Altair, Matplotlib, seaborn과 같은 다른 라이브러리를 사용하여 데이터를 대화형으로 시각화할 수 있습니다.

  • 마크다운 셀을 사용하여 결과에 맥락을 제공하고 다양한 결과에 대한 메모를 작성할 수 있습니다.

  • 셀과 그 앞에 있는 모든 수정된 셀을 실행하는 기본 동작을 사용하여 데이터를 최신 상태로 유지하거나 셀별로 실행하여 노트북을 디버그할 수 있습니다.

  • 일정에 따라 노트북을 실행합니다. Snowflake Notebook을 실행하도록 예약합니다 섹션을 참조하십시오.

  • Snowflake에서 제공되는 역할 기반 액세스 제어 및 기타 데이터 거버넌스 기능을 사용하여 역할이 동일한 다른 사용자들이 노트북을 보고 공동 작업을 수행할 수 있도록 할 수 있습니다.

Snowsight UI의 노트북 예제

노트북 런타임

Snowflake Notebooks 는 웨어하우스 런타임과 컨테이너 런타임의 두 가지 유형의 런타임을 제공합니다. Notebooks는 컴퓨팅 리소스를 제공하기 위해 가상 웨어하우스 및/또는 Snowpark Container Services 컴퓨팅 풀을 사용합니다. 두 아키텍처 모두에서 SQL 및 Snowpark 쿼리는 최적화된 성능을 위해 항상 웨어하우스에서 실행되도록 푸시 다운됩니다.

웨어하우스 런타임은 일반적으로 사용 가능한 익숙한 웨어하우스 환경을 통해 가장 빠르게 시작할 수 있는 방법을 제공합니다. 컨테이너 런타임은 SQL 분석 및 데이터 엔지니어링을 비롯한 다양한 유형의 워크로드를 지원할 수 있는 더욱 유연한 환경을 제공합니다. 컨테이너 런타임에 기본적으로 필요한 패키지가 포함되어 있지 않으면 추가 Python 패키지를 설치할 수 있습니다. Container Runtime은 또한 널리 사용되는 여러 ML 패키지가 사전 설치된 CPU 및 GPU 버전으로 제공되므로 ML 및 딥 러닝 워크로드에 이상적입니다.

다음 테이블은 각 런타임 유형에 대해 지원되는 기능을 보여줍니다. 이 테이블을 사용하여 사용 사례에 적합한 런타임을 결정하는 데 도움을 받을 수 있습니다.

지원되는 기능

웨어하우스 런타임

Container Runtime

컴퓨팅

커널은 Snowflake가 관리하는 기본 웨어하우스에서 실행됩니다.

커널은 컴퓨팅 풀 노드에서 실행됩니다.

환경

Python 3.9

Python 3.10

기본 이미지

Streamlit + Snowpark

Snowflake 컨테이너 런타임. CPU 및 GPU 이미지에는 Python 라이브러리 세트가 사전 설치되어 있습니다.

추가 Python 라이브러리

Snowflake anaconda를 사용하거나 Snowflake 스테이지에서 설치합니다.

pip 를 사용하거나 Snowflake 스테이지에서 설치합니다.

편집 지원

  • Python, SQL 및 마크다운 셀.

  • Python 셀에서 SQL 셀의 출력을 참조하고 그 반대의 경우도 마찬가지입니다.

  • Streamlit과 같은 시각화 라이브러리를 사용합니다.

웨어하우스와 동일

액세스

노트북에 액세스하고 편집하려면 소유권이 필요합니다.

웨어하우스와 동일

지원되는 노트북 기능

  • Git 통합

  • 다중 파일 편집

  • 예약하기

웨어하우스와 동일

Snowflake Notebooks 시작하기

Snowflake Notebooks 를 사용하여 실험을 시작하려면 Snowsight 에 로그인하고 노트북을 사용하도록 계정을 설정한 다음, Projects 창에서 Notebooks 를 선택합니다. 사용자 계정에서 액세스할 수 있는 노트북 목록이 표시됩니다. 처음부터 새 노트북을 생성하거나 기존 .ipynb 파일을 업로드할 수 있습니다.

다음 테이블에는 Snowflake Notebooks 를 처음 사용하는 경우 검토해야 할 항목이 나와 있습니다.

시작하기 가이드

Snowflake 노트북 설정

Snowflake Notebooks 설정하기

Notebook을 사용하기 전 개발자와 관리자를 위한 지침입니다.

Snowflake 노트북 만들기

Snowflake 노트북 만들기

처음부터 또는 기존 파일에서 새 노트북을 만듭니다.

Snowflake Notebook에서 코드 개발 및 실행

Snowflake 노트북에서 코드 개발 및 실행

Python, SQL, 마크다운 셀을 생성, 편집, 실행합니다.

개발자 가이드

가이드

설명

노트북의 세션 컨텍스트

세션 컨텍스트에 액세스하고 수정합니다.

노트북에 결과 저장하기

세션 전체에 걸쳐 노트북과 결과를 저장합니다.

노트북에서 사용할 Python 패키지 가져오기

Anaconda 채널에서 Python 패키지를 가져옵니다.

노트북에서 데이터 시각화 및 상호 작용

matplotlib, plotly, altair를 사용하여 데이터를 시각화하고 Streamlit을 사용하여 데이터 앱을 개발합니다.

노트북에서 셀 및 변수 참조

참조 SQL 셀 출력 및 Python 변수 값.

노트북용 단축키

단축키를 활용해 탐색하고 편집 환경을 간소화합니다.

노트북 워크플로 수준 높이기

가이드

설명

Git와 Snowflake Notebooks 동기화

공동 작업과 개발을 위해 노트북의 버전을 관리합니다.

노트북에서 파일 작업

노트북 환경에서 파일을 관리하고 작업합니다.

노트북 실행 예약

Snowflake 내에서 코드를 실행하고 실행하기 위해 노트북을 예약합니다.

노트북으로 Snowflake 체험하기

Snowflake Notebooks 내에서 다른 Snowflake 기능을 활용합니다.

Snowflake Notebooks 의 오류 문제 해결

Snowflake Notebooks 를 사용하는 동안 발생할 수 있는 오류를 해결합니다.

빠른 시작

강조된 사용 사례

데이터 과학, 데이터 엔지니어링 및 ML/AI에 대한 주요 사용 사례를 Github 에서 살펴볼 수 있습니다.

Snowflake Notebook에서의 데이터 엔지니어링

데이터 엔지니어링

SQL 및 Snowpark를 사용하여 확장 가능한 데이터 파이프라인을 개발, 관리, 예약, 실행할 수 있습니다.

Snowflake Notebook을 사용한 데이터 과학

데이터 과학

Python 및 SQL을 사용하여 데이터를 탐색, 시각화, 분석할 수 있습니다.

Snowflake Notebook을 사용한 머신 러닝

머신 러닝 및 AI

Cortex 및 Snowpark ML을 사용한 피처 엔지니어링, 모델 훈련 및 개발.

참고

이러한 데모는 예제로만 보여주는 것이며, 예제를 따라 실습하려면 Snowflake가 소유하거나 제공하지 않는 서드 파티 데이터, 제품 또는 서비스에 대한 권한이 추가로 필요할 수 있습니다. Snowflake는 이러한 예제의 정확성을 보장하지 않습니다.

추가 리소스

  • 노트북 데모, 자습서 및 예제는 Github 의 Snowflake Notebooks 데모 모음을 참조하십시오.

  • 자습서 비디오를 보려면 Snowflake Notebooks Youtube 재생 목록 을 참조하십시오.

  • 노트북을 만들고, 실행하고, 표시하는 SQL 명령에 대해 알아보려면 Snowflake Notebooks API 참조 를 참조하십시오.

  • 노트북을 사용하는 레퍼런스 아키텍처, 산업별 사용 사례 및 솔루션 모범 사례를 찾고 계신가요? Snowflake Solution Center에서 노트북 예제 를 살펴보십시오.