Snowflake Notebooks 정보¶
Snowflake Notebooks 는 Python 및 SQL용 대화형 셀 기반 프로그래밍 환경을 제공하는 Snowsight의 개발 인터페이스입니다. Snowflake Notebooks 에서는 탐색적 데이터 분석을 수행하고, 머신 러닝 모델을 개발하고, 기타 데이터 과학 및 데이터 엔지니어링 작업을 모두 한곳에서 수행할 수 있습니다.
이미 Snowflake에 있는 데이터를 탐색하고 실험하거나 로컬 파일, 외부 클라우드 저장소 또는 Snowflake Marketplace 의 데이터 세트에서 새 데이터를 Snowflake에 업로드할 수 있습니다.
SQL 또는 Python 코드를 작성하고 셀 단위로 개발 및 실행하여 결과를 빠르게 비교할 수 있습니다.
Streamlit 시각화와 Altair, Matplotlib, seaborn과 같은 다른 라이브러리를 사용하여 데이터를 대화형으로 시각화할 수 있습니다.
마크다운 셀을 사용하여 결과에 맥락을 제공하고 다양한 결과에 대한 메모를 작성할 수 있습니다.
셀과 그 앞에 있는 모든 수정된 셀을 실행하는 기본 동작을 사용하여 데이터를 최신 상태로 유지하거나 셀별로 실행하여 노트북을 디버그할 수 있습니다.
일정에 따라 노트북을 실행합니다. Snowflake Notebook을 실행하도록 예약합니다 섹션을 참조하십시오.
Snowflake에서 제공되는 역할 기반 액세스 제어 및 기타 데이터 거버넌스 기능을 사용하여 역할이 동일한 다른 사용자들이 노트북을 보고 공동 작업을 수행할 수 있도록 할 수 있습니다.

노트북 런타임¶
Snowflake Notebooks 는 웨어하우스 런타임과 컨테이너 런타임의 두 가지 유형의 런타임을 제공합니다. Notebooks는 컴퓨팅 리소스를 제공하기 위해 가상 웨어하우스 및/또는 Snowpark Container Services 컴퓨팅 풀을 사용합니다. 두 아키텍처 모두에서 SQL 및 Snowpark 쿼리는 최적화된 성능을 위해 항상 웨어하우스에서 실행되도록 푸시 다운됩니다.
웨어하우스 런타임은 일반적으로 사용 가능한 익숙한 웨어하우스 환경을 통해 가장 빠르게 시작할 수 있는 방법을 제공합니다. 컨테이너 런타임은 SQL 분석 및 데이터 엔지니어링을 비롯한 다양한 유형의 워크로드를 지원할 수 있는 더욱 유연한 환경을 제공합니다. 컨테이너 런타임에 기본적으로 필요한 패키지가 포함되어 있지 않으면 추가 Python 패키지를 설치할 수 있습니다. Container Runtime은 또한 널리 사용되는 여러 ML 패키지가 사전 설치된 CPU 및 GPU 버전으로 제공되므로 ML 및 딥 러닝 워크로드에 이상적입니다.
다음 테이블은 각 런타임 유형에 대해 지원되는 기능을 보여줍니다. 이 테이블을 사용하여 사용 사례에 적합한 런타임을 결정하는 데 도움을 받을 수 있습니다.
지원되는 기능 |
웨어하우스 런타임 |
Container Runtime |
---|---|---|
컴퓨팅 |
커널은 Snowflake가 관리하는 기본 웨어하우스에서 실행됩니다. |
커널은 컴퓨팅 풀 노드에서 실행됩니다. |
환경 |
Python 3.9 |
Python 3.10 |
기본 이미지 |
Streamlit + Snowpark |
Snowflake 컨테이너 런타임. CPU 및 GPU 이미지에는 Python 라이브러리 세트가 사전 설치되어 있습니다. |
추가 Python 라이브러리 |
Snowflake anaconda를 사용하거나 Snowflake 스테이지에서 설치합니다. |
|
편집 지원 |
|
웨어하우스와 동일 |
액세스 |
노트북에 액세스하고 편집하려면 소유권이 필요합니다. |
웨어하우스와 동일 |
지원되는 노트북 기능 |
|
웨어하우스와 동일 |
Snowflake Notebooks 시작하기¶
Snowflake Notebooks 를 사용하여 실험을 시작하려면 Snowsight 에 로그인하고 노트북을 사용하도록 계정을 설정한 다음, Projects 창에서 Notebooks 를 선택합니다. 사용자 계정에서 액세스할 수 있는 노트북 목록이 표시됩니다. 처음부터 새 노트북을 생성하거나 기존 .ipynb
파일을 업로드할 수 있습니다.
다음 테이블에는 Snowflake Notebooks 를 처음 사용하는 경우 검토해야 할 항목이 나와 있습니다.
시작하기 가이드 |
|
---|---|
Notebook을 사용하기 전 개발자와 관리자를 위한 지침입니다. |
|
처음부터 또는 기존 파일에서 새 노트북을 만듭니다. |
|
Python, SQL, 마크다운 셀을 생성, 편집, 실행합니다. |
개발자 가이드¶
가이드 |
설명 |
---|---|
세션 컨텍스트에 액세스하고 수정합니다. |
|
세션 전체에 걸쳐 노트북과 결과를 저장합니다. |
|
Anaconda 채널에서 Python 패키지를 가져옵니다. |
|
matplotlib, plotly, altair를 사용하여 데이터를 시각화하고 Streamlit을 사용하여 데이터 앱을 개발합니다. |
|
참조 SQL 셀 출력 및 Python 변수 값. |
|
단축키를 활용해 탐색하고 편집 환경을 간소화합니다. |
노트북 워크플로 수준 높이기¶
가이드 |
설명 |
---|---|
공동 작업과 개발을 위해 노트북의 버전을 관리합니다. |
|
노트북 환경에서 파일을 관리하고 작업합니다. |
|
Snowflake 내에서 코드를 실행하고 실행하기 위해 노트북을 예약합니다. |
|
Snowflake Notebooks 내에서 다른 Snowflake 기능을 활용합니다. |
|
Snowflake Notebooks 를 사용하는 동안 발생할 수 있는 오류를 해결합니다. |
빠른 시작¶
첫 번째 Snowflake 노트북 시작하기 [비디오] [소스]
10분 이내에 첫 번째 노트북 프로젝트를 빠르게 시작하는 방법을 알아보십시오.
Snowflake Notebooks를 사용한 시각적 데이터 스토리 [비디오] [소스]
노트북에서 코드와 데이터와 함께 시각화, 마크다운, 이미지, 대화형 데이터 앱을 사용해 설득력 있는 데이터 내러티브를 만드는 방법을 알아보십시오.
강조된 사용 사례¶
데이터 과학, 데이터 엔지니어링 및 ML/AI에 대한 주요 사용 사례를 Github 에서 살펴볼 수 있습니다.
SQL 및 Snowpark를 사용하여 확장 가능한 데이터 파이프라인을 개발, 관리, 예약, 실행할 수 있습니다. |
|
Python 및 SQL을 사용하여 데이터를 탐색, 시각화, 분석할 수 있습니다. |
|
Cortex 및 Snowpark ML을 사용한 피처 엔지니어링, 모델 훈련 및 개발. |
참고
이러한 데모는 예제로만 보여주는 것이며, 예제를 따라 실습하려면 Snowflake가 소유하거나 제공하지 않는 서드 파티 데이터, 제품 또는 서비스에 대한 권한이 추가로 필요할 수 있습니다. Snowflake는 이러한 예제의 정확성을 보장하지 않습니다.
추가 리소스¶
노트북 데모, 자습서 및 예제는 Github 의 Snowflake Notebooks 데모 모음을 참조하십시오.
자습서 비디오를 보려면 Snowflake Notebooks Youtube 재생 목록 을 참조하십시오.
노트북을 만들고, 실행하고, 표시하는 SQL 명령에 대해 알아보려면 Snowflake Notebooks API 참조 를 참조하십시오.
노트북을 사용하는 레퍼런스 아키텍처, 산업별 사용 사례 및 솔루션 모범 사례를 찾고 계신가요? Snowflake Solution Center에서 노트북 예제 를 살펴보십시오.