데이터 프로파일링을 사용하여 데이터 이해¶
데이터 프로파일링은 데이터 타입, 값 분포, NULL 값 개수 및 고유성과 같은 통계를 자동으로 수집하여 데이터 세트의 구조, 내용, 품질을 이해하는 데 도움이 됩니다. 데이터 프로필을 통해 패턴, 이상 및 잠재적인 품질 문제를 파악할 수 있으므로, 데이터 신뢰성을 평가하고 데이터를 정리, 변환 또는 효과적으로 사용하는 방법에 대해 정보에 기반한 결정을 내릴 수 있습니다. 데이터 프로파일링은 수동 설정 없이도 인사이트를 제공하므로, 지속적인 데이터 품질 모니터링 방법을 간소화할 수 있습니다.
데이터 프로필에는 다음 통계가 포함됩니다.
테이블의 행 수입니다.
마지막으로 테이블이 업데이트된 시간.
열에 있는 NULL 값의 수.
열의 최소값 및 최대값.
열의 가장 일반적인 값.
시작하기¶
테이블 또는 뷰의 데이터 프로필을 보려면 다음 단계를 완료합니다.
웨어하우스 고려 사항¶
데이터 프로파일링은 백그라운드에서 SQL 쿼리를 실행하여 테이블 또는 뷰에 대한 정보를 표시합니다. Snowflake는 X-Small 웨어하우스를 사용하여 이러한 쿼리를 실행할 것을 권장합니다. 하지만 대량의 워크로드가 있을 때 더 큰 규모의 웨어하우스 사용하면 성능이 개선될 수 있습니다. 일반적으로 웨어하우스가 클수록 더 많은 크레딧을 사용합니다.
기본적으로, 데이터 프로파일링은 현재 사용자의 기본값으로 설정된 웨어하우스를 사용합니다. 다른 웨어하우스를 선택하려면 페이지 상단의 드롭다운 목록을 사용합니다.