Snowflake Notebooks 에서 데이터 시각화

Snowflake Notebooks 에서는, 자주 사용하는 Python 시각화 라이브러리(예: matplotlib, plotly 등)를 사용하여 시각화를 개발할 수 있습니다.

이 항목에서는 다음 라이브러리를 사용하여 노트북의 데이터를 시각화하는 방법을 보여줍니다.

데이터 세트

이 항목의 예제에서는 Palmer’s Penguin 데이터 세트 를 기반으로 하는 다음 장난감 데이터 세트를 사용합니다.

species

measurement

adeli

bill_length

37.3

adeli

flipper_length

187.1

adeli

bill_depth

17.7

chinstrap

bill_length

46.6

chinstrap

flipper_length

191.7

chinstrap

bill_depth

17.6

gentoo

bill_length

45.5

gentoo

flipper_length

212.7

gentoo

bill_depth

14.2

다음 코드를 사용하여 노트북에서 이 데이터 세트를 만들 수 있습니다.

species = ["adelie"] * 3 + ["chinstrap"] * 3 + ["gentoo"] * 3
measurements = ["bill_length", "flipper_length", "bill_depth"] * 3
values = [37.3, 187.1, 17.7, 46.6, 191.7, 17.6, 45.5, 212.7, 14.2]
df = pd.DataFrame({"species": species,"measurement": measurements,"value": values})
df
Copy

Altair를 사용한 결과 시각화

Altair는 기본적으로 Streamlit의 일부로 Snowflake Notebooks 에서 가져옵니다. Snowflake Notebooks 는 현재 Altair 버전 4.0을 지원합니다. Altair를 사용할 때 사용할 수 있는 시각화 유형에 대한 자세한 내용은 Vega-Altair: Python에서의 선언적 시각화 섹션을 참조하십시오.

다음 코드는 장난감 데이터 세트가 포함된 이름이 df 인 데이터 프레임에 있는 모든 측정값의 누적 막대형 차트를 표시합니다.

import altair as alt
alt.Chart(df).mark_bar().encode(
    x= alt.X("measurement", axis = alt.Axis(labelAngle=0)),
    y="value",
    color="species"
)
Copy

셀을 실행하면 다음과 같은 시각화가 나타납니다.

각 펭귄 유형에 대한 측정값의 누적값을 보여주는 누적 막대형 차트입니다.

matplotlib를 사용한 결과 시각화

matplotlib을 사용하려면 노트북에 matplotlib 라이브러리를 설치합니다.

  1. 노트북에서 Packages 를 선택합니다.

  2. matplotlib 라이브러리를 찾아서 설치할 라이브러리를 선택합니다.

다음 코드는 matplotlib를 사용하여 장난감 데이터 세트 df 를 플로팅합니다.

import matplotlib.pyplot as plt

pivot_df = pd.pivot_table(data=df, index=['measurement'], columns=['species'], values='value')

import matplotlib.pyplot as plt
ax = pivot_df.plot.bar(stacked=True)
ax.set_xticklabels(list(pivot_df.index), rotation=0)
Copy

셀을 실행하면 다음과 같은 시각화가 나타납니다.

각 펭귄 유형에 대한 측정값의 누적값을 보여주는 누적 막대형 차트입니다.

st.pyplot 차트 요소 사용에 대한 자세한 내용은 st.pyplot 섹션을 참조하십시오.

Plotly를 사용한 결과 시각화

plotly를 사용하려면 노트북에 plotly 라이브러리를 설치합니다.

  1. 노트북에서 Packages 를 선택합니다.

  2. plotly 라이브러리를 찾아서 설치할 라이브러리를 선택합니다.

다음 코드는 장난감 데이터 세트 df 의 펭귄 측정값을 막대형 차트에 표시합니다.

import plotly.express as px
px.bar(df, x='measurement', y='value', color='species')
Copy

셀을 실행하면 다음과 같은 시각화가 나타납니다.

각 펭귄 유형에 대한 측정값의 누적값을 보여주는 누적 막대형 차트입니다.

seaborn을 사용한 결과 시각화

seaborn을 사용하려면 노트북에 seaborn 라이브러리를 설치해야 합니다.

  1. 노트북에서 Packages 를 선택합니다.

  2. seaborn 라이브러리를 찾아서 설치할 라이브러리를 선택합니다.

다음 코드는 장난감 데이터 세트 df 의 펭귄 측정값을 막대형 차트에 표시합니다.

import seaborn as sns

sns.barplot(
    data=df,
    x="measurement", hue="species", y="value",
)
Copy

셀을 실행하면 다음과 같은 시각화가 나타납니다.

각 펭귄 유형에 대한 측정값을 보여주는 막대형 차트입니다.

seaborn 시각화에 대한 더 많은 예제를 보려면 seaborn 예제 갤러리 를 참조하십시오.

Streamlit을 사용한 결과 시각화

Streamlit도 기본적으로 Snowflake Notebooks 에서 가져옵니다. Streamlit 버전 1.22.0에서 지원하는 모든 차트 요소를 사용하여 선형 차트, 막대 차트, 영역형 차트 또는 점이 있는 지도를 생성할 수 있습니다. 차트 요소 를 참조하십시오.

참고

일부 Streamlit 차트 요소는 Snowflake에서 지원되지 않거나 추가 약관이 적용될 수 있습니다. 노트북의 Streamlit 지원 섹션을 참조하십시오.

장난감 데이터 세트 df 를 막대형 차트에 시각화하려면 다음 Python 코드를 사용할 수 있습니다.

import streamlit as st

st.bar_chart(df, x='measurement', y='value', color='species')
Copy

두 셀을 모두 실행하면 다음과 같은 시각화가 나타납니다.

각 펭귄 종에 대한 펭귄 측정치를 누적한 막대형 차트입니다.

다음 단계

  • Streamlit을 사용하여 대화형 데이터 앱을 만드는 방법에 대해 자세히 알아보십시오. 노트북의 Streamlit 섹션을 참조하십시오.