Snowflake Notebooks 에서 데이터 시각화¶
Snowflake Notebooks 에서는, 자주 사용하는 Python 시각화 라이브러리(예: matplotlib, plotly 등)를 사용하여 시각화를 개발할 수 있습니다.
이 항목에서는 다음 라이브러리를 사용하여 노트북의 데이터를 시각화하는 방법을 보여줍니다.
데이터 세트¶
이 항목의 예제에서는 Palmer’s Penguin 데이터 세트 를 기반으로 하는 다음 장난감 데이터 세트를 사용합니다.
species |
measurement |
값 |
---|---|---|
adeli |
bill_length |
37.3 |
adeli |
flipper_length |
187.1 |
adeli |
bill_depth |
17.7 |
chinstrap |
bill_length |
46.6 |
chinstrap |
flipper_length |
191.7 |
chinstrap |
bill_depth |
17.6 |
gentoo |
bill_length |
45.5 |
gentoo |
flipper_length |
212.7 |
gentoo |
bill_depth |
14.2 |
다음 코드를 사용하여 노트북에서 이 데이터 세트를 만들 수 있습니다.
species = ["adelie"] * 3 + ["chinstrap"] * 3 + ["gentoo"] * 3
measurements = ["bill_length", "flipper_length", "bill_depth"] * 3
values = [37.3, 187.1, 17.7, 46.6, 191.7, 17.6, 45.5, 212.7, 14.2]
df = pd.DataFrame({"species": species,"measurement": measurements,"value": values})
df
Altair를 사용한 결과 시각화¶
Altair는 기본적으로 Streamlit의 일부로 Snowflake Notebooks 에서 가져옵니다. Snowflake Notebooks 는 현재 Altair 버전 4.0을 지원합니다. Altair를 사용할 때 사용할 수 있는 시각화 유형에 대한 자세한 내용은 Vega-Altair: Python에서의 선언적 시각화 섹션을 참조하십시오.
다음 코드는 장난감 데이터 세트가 포함된 이름이 df
인 데이터 프레임에 있는 모든 측정값의 누적 막대형 차트를 표시합니다.
import altair as alt
alt.Chart(df).mark_bar().encode(
x= alt.X("measurement", axis = alt.Axis(labelAngle=0)),
y="value",
color="species"
)
셀을 실행하면 다음과 같은 시각화가 나타납니다.
matplotlib를 사용한 결과 시각화¶
matplotlib을 사용하려면 노트북에 matplotlib 라이브러리를 설치합니다.
노트북에서 Packages 를 선택합니다.
matplotlib 라이브러리를 찾아서 설치할 라이브러리를 선택합니다.
다음 코드는 matplotlib를 사용하여 장난감 데이터 세트 df
를 플로팅합니다.
import matplotlib.pyplot as plt
pivot_df = pd.pivot_table(data=df, index=['measurement'], columns=['species'], values='value')
import matplotlib.pyplot as plt
ax = pivot_df.plot.bar(stacked=True)
ax.set_xticklabels(list(pivot_df.index), rotation=0)
셀을 실행하면 다음과 같은 시각화가 나타납니다.
st.pyplot
차트 요소 사용에 대한 자세한 내용은 st.pyplot 섹션을 참조하십시오.
Plotly를 사용한 결과 시각화¶
plotly를 사용하려면 노트북에 plotly 라이브러리를 설치합니다.
노트북에서 Packages 를 선택합니다.
plotly 라이브러리를 찾아서 설치할 라이브러리를 선택합니다.
다음 코드는 장난감 데이터 세트 df
의 펭귄 측정값을 막대형 차트에 표시합니다.
import plotly.express as px
px.bar(df, x='measurement', y='value', color='species')
셀을 실행하면 다음과 같은 시각화가 나타납니다.
seaborn을 사용한 결과 시각화¶
seaborn을 사용하려면 노트북에 seaborn 라이브러리를 설치해야 합니다.
노트북에서 Packages 를 선택합니다.
seaborn 라이브러리를 찾아서 설치할 라이브러리를 선택합니다.
다음 코드는 장난감 데이터 세트 df
의 펭귄 측정값을 막대형 차트에 표시합니다.
import seaborn as sns
sns.barplot(
data=df,
x="measurement", hue="species", y="value",
)
셀을 실행하면 다음과 같은 시각화가 나타납니다.
seaborn 시각화에 대한 더 많은 예제를 보려면 seaborn 예제 갤러리 를 참조하십시오.
Streamlit을 사용한 결과 시각화¶
Streamlit도 기본적으로 Snowflake Notebooks 에서 가져옵니다. Streamlit 버전 1.22.0에서 지원하는 모든 차트 요소를 사용하여 선형 차트, 막대 차트, 영역형 차트 또는 점이 있는 지도를 생성할 수 있습니다. 차트 요소 를 참조하십시오.
참고
일부 Streamlit 차트 요소는 Snowflake에서 지원되지 않거나 추가 약관이 적용될 수 있습니다. 노트북의 Streamlit 지원 섹션을 참조하십시오.
장난감 데이터 세트 df
를 막대형 차트에 시각화하려면 다음 Python 코드를 사용할 수 있습니다.
import streamlit as st
st.bar_chart(df, x='measurement', y='value', color='species')
두 셀을 모두 실행하면 다음과 같은 시각화가 나타납니다.
다음 단계¶
Streamlit을 사용하여 대화형 데이터 앱을 만드는 방법에 대해 자세히 알아보십시오. 노트북의 Streamlit 섹션을 참조하십시오.