Snowflake Notebooks 정보¶
Snowflake Notebooks 는 Python, SQL , Markdown을 위한 대화형 셀 기반 프로그래밍 환경을 제공하는 통합 개발 인터페이스(Snowsight)입니다. Snowflake Notebooks 에서는 탐색적 데이터 분석을 수행하고, 머신 러닝 모델을 개발하고, 기타 데이터 과학 및 데이터 엔지니어링 워크플로를 수행하는 데 Snowflake 데이터를 활용할 수 있으며, 이 모든 것을 동일한 인터페이스 내에서 수행할 수 있습니다.
이미 Snowflake에 있는 데이터를 탐색하고 실험하거나 로컬 파일, 외부 클라우드 저장소 또는 Snowflake Marketplace 의 데이터 세트에서 새 데이터를 Snowflake에 업로드할 수 있습니다.
SQL 또는 Python 코드를 작성하고 셀 단위로 개발 및 실행하여 결과를 빠르게 비교할 수 있습니다.
Streamlit 시각화와 Altair, Matplotlib, seaborn과 같은 다른 라이브러리를 사용하여 데이터를 대화형으로 시각화할 수 있습니다.
Git과 통합하여 효과적인 버전 관리로 협업하십시오. Git 리포지토리와 Snowflake Notebooks 동기화 섹션을 참조하십시오.
마크다운 셀과 차트를 사용해 결과를 맥락화하고 다양한 결과에 대한 메모를 작성하십시오.
예약된 일정에 따라 노트북을 실행해 파이프라인을 자동화하십시오. Snowflake Notebook을 실행하도록 예약합니다 섹션을 참조하십시오.
Snowflake에서 제공되는 역할 기반 액세스 제어 및 기타 데이터 거버넌스 기능을 사용하여 역할이 동일한 다른 사용자들이 노트북을 보고 공동 작업을 수행할 수 있도록 할 수 있습니다.
개인 데이터베이스에 저장된 개인 노트북을 만들어 대화형으로 코드를 개발하고 프로덕션 데이터 자산으로 실험해 볼 수 있습니다. 비공개 노트북 섹션을 참조하십시오.

노트북 런타임¶
Snowflake Notebooks 는 웨어하우스 런타임과 컨테이너 런타임의 두 가지 유형의 런타임을 제공합니다. Notebooks는 컴퓨팅 리소스를 제공하기 위해 가상 웨어하우스 및/또는 Snowpark Container Services 컴퓨팅 풀을 사용합니다. 두 아키텍처 모두에서 SQL 및 Snowpark 쿼리는 최적화된 성능을 위해 항상 웨어하우스에서 실행되도록 푸시 다운됩니다.
웨어하우스 런타임은 일반적으로 사용 가능한 익숙한 웨어하우스 환경을 통해 가장 빠르게 시작할 수 있는 방법을 제공합니다. 컨테이너 런타임은 SQL 분석 및 데이터 엔지니어링을 비롯한 다양한 유형의 워크로드를 지원할 수 있는 더욱 유연한 환경을 제공합니다. 컨테이너 런타임에 기본적으로 필요한 패키지가 포함되어 있지 않으면 추가 Python 패키지를 설치할 수 있습니다. 컨테이너 런타임은 CPU 및 GPU 버전으로도 제공되며, 널리 사용되는 ML 패키지가 사전 설치되어 있어 ML 및 딥러닝 워크로드에 이상적입니다.
다음 테이블은 각 런타임 유형에 대해 지원되는 기능을 보여줍니다. 이 테이블을 사용하여 사용 사례에 적합한 런타임을 결정하는 데 도움을 받을 수 있습니다.
지원되는 기능 |
웨어하우스 런타임 |
Container Runtime |
---|---|---|
컴퓨팅 |
커널은 노트북 웨어하우스에서 실행됩니다. |
커널은 Compute Pool 노드에서 실행됩니다. |
환경 |
Python 3.9 |
Python 3.10 |
기본 이미지 |
Streamlit + Snowpark |
Snowflake 컨테이너 런타임. CPU 및 GPU 이미지에는 Python 라이브러리 세트가 사전 설치되어 있습니다. |
추가 Python 라이브러리 |
Snowflake anaconda를 사용하거나 Snowflake 스테이지에서 설치합니다. |
|
편집 지원 |
|
웨어하우스와 동일 |
액세스 |
노트북에 액세스하고 편집하려면 소유권이 필요합니다. |
웨어하우스와 동일 |
지원되는 노트북 기능(아직 미리 보기로 제공됨) |
|
웨어하우스와 동일 |
Snowflake Notebooks 시작하기¶
Snowflake Notebooks 를 사용하여 실험을 시작하려면 Snowsight 에 로그인하고 노트북을 사용하도록 계정을 설정한 다음, Projects 창에서 Notebooks 를 선택합니다. 사용자 계정에서 액세스할 수 있는 노트북 목록이 표시됩니다. 처음부터 새 노트북을 생성하거나 기존 .ipynb
파일을 업로드할 수 있습니다.
다음 테이블에는 Snowflake Notebooks 를 처음 사용하는 경우 검토해야 할 항목이 나와 있습니다.
시작하기 가이드 |
|
---|---|
Notebook을 사용하기 전 개발자와 관리자를 위한 지침입니다. |
|
처음부터 또는 기존 파일에서 새 노트북을 만듭니다. |
|
Python, SQL, 마크다운 셀을 생성, 편집, 실행합니다. |
개발자 가이드¶
가이드 |
설명 |
---|---|
세션 컨텍스트에 액세스하고 수정합니다. |
|
여러 세션에 걸쳐 노트북과 결과를 저장합니다. |
|
Anaconda 채널에서 Python 패키지를 가져옵니다. |
|
matplotlib, plotly, altair를 사용하여 데이터를 시각화하고 Streamlit을 사용하여 데이터 앱을 개발합니다. |
|
참조 SQL 셀 출력 및 Python 변수 값. |
|
단축키를 활용해 탐색하고 편집 환경을 간소화합니다. |
노트북 워크플로 수준 높이기¶
가이드 |
설명 |
---|---|
공동 작업과 개발을 위해 노트북의 버전을 관리합니다. |
|
노트북 환경에서 파일을 관리하고 작업합니다. |
|
Snowflake 내에서 코드를 실행하고 실행하기 위해 노트북을 예약합니다. |
|
Snowflake Notebooks 내에서 다른 Snowflake 기능을 활용합니다. |
|
Snowflake Notebooks 를 사용하는 동안 발생할 수 있는 오류를 해결합니다. |
빠른 시작¶
첫 번째 Snowflake 노트북 시작하기 [비디오] [소스]
10분 이내에 첫 번째 노트북 프로젝트를 빠르게 시작하는 방법을 알아보십시오.
Snowflake Notebooks를 사용한 시각적 데이터 스토리 [비디오] [소스]
노트북에서 코드와 데이터와 함께 시각화, 마크다운, 이미지, 대화형 데이터 앱을 사용해 설득력 있는 데이터 내러티브를 만드는 방법을 알아보십시오.
강조된 사용 사례¶
데이터 과학, 데이터 엔지니어링 및 ML/AI에 대한 주요 사용 사례를 Github 에서 살펴볼 수 있습니다.
SQL 및 Snowpark를 사용하여 확장 가능한 데이터 파이프라인을 개발, 관리, 예약, 실행할 수 있습니다. |
|
Python 및 SQL을 사용하여 데이터를 탐색, 시각화, 분석할 수 있습니다. |
|
Cortex 및 Snowpark ML을 사용한 피처 엔지니어링, 모델 훈련 및 개발. |
참고
이러한 빠른 시작은 예시로만 표시됩니다. 이 예시를 따르기 위해서는 Snowflake가 소유하거나 제공하지 않는 서드 파티 데이터, 제품 또는 서비스에 대한 추가 권한이 필요할 수 있습니다. Snowflake는 이러한 예제의 정확성을 보장하지 않습니다.
추가 리소스¶
노트북 데모, 자습서 및 예제는 GitHub 의 Snowflake Notebooks 데모 모음을 참조하십시오.
자습서 동영상을 보려면 Snowflake Notebooks YouTube 재생 목록 섹션을 참조하십시오.
노트북을 만들고, 실행하고, 표시하는 SQL 명령에 대해 알아보려면 Snowflake Notebooks API 참조 를 참조하십시오.
노트북을 사용하는 레퍼런스 아키텍처, 산업별 사용 사례 및 솔루션 모범 사례를 찾고 계신가요? Snowflake Solution Center에서 노트북 예제 를 살펴보십시오.