Snowflake의 모델 추론¶
Snowflake는 두 가지 고유한 컴퓨팅 엔진을 사용합니다.
웨어하우스(SQL 엔진)
Snowpark Container Service
Snowflake Model Registry는 두 엔진 모두에 통합 인터페이스를 제공합니다. 사용 사례에 최적의 환경은 대기 시간, 데이터 타입, 확장 요구 사항에 따라 다릅니다. Snowflake는 추론 워크플로에 대해 다음과 같은 접근 방식을 제공합니다.
실시간 추론(REST API): 대기 시간이 짧은 실시간 사용 사례를 위해 설계되었습니다. 요청은 HTTP를 통해 용이하게 수행되며, 외부 애플리케이션을 구동하는 데 적합합니다.
Snowflake 네이티브 일괄 추론(SQL): Snowflake SQL 생태계와의 통합이 필요한 일괄 워크로드용으로 설계됩니다. 예를 들어 일괄 워크로드는 Dynamic Tables, Snowpark, DBT, User Tasks와 통합할 수 있습니다. SQL 함수를 사용하여 데이터를 이동하거나 외부 인프라를 관리하지 않고도 기존 데이터 파이프라인에 인텔리전스를 직접 포함할 수 있습니다.
작업 기반 일괄 추론: 이 접근 방식은 추론이 독립 실행형 컴퓨팅 스테이지로 처리되는 높은 처리량의 분산 처리를 위해 설계되었습니다. SQL 엔진에서 추론을 분리하여 가격과 성능 모두를 위해 최적화할 수 있습니다. 일괄 추론을 사용하면 대규모 데이터 세트를 처리하거나 복잡한 계산 요구 사항을 탐색하는 데 도움이 될 수 있습니다. 이는 이미지, 비디오, 오디오 등의 파일을 Snowflake 스테이지에서 직접 처리하는 데 적합합니다.
선택 시기¶
다음 테이블을 사용하여 특정 워크로드 요구 사항을 올바른 컴퓨팅 패턴에 맞춥니다.
특징 |
실시간 추론(SPCS) |
네이티브 일괄 추론(SQL) |
작업 기반 배치(SPCS) |
|---|---|---|---|
기본 목표 |
대화형 응답: 라이브 사용자를 위한 대기 시간이 1초 미만으로 짧은 피드백. |
인라인 인텔리전스: SQL데이터 파이프라인에 원활하게 모델 포함. |
독립 실행형 처리: 비정형 데이터를 위한 분리된 대규모 컴퓨팅. |
적합한 경우 |
• Web/Mobile app backends.
• Real-time user interactions.
• High-concurrency request spikes.
|
• Upstream pipelines (Dynamic Tables, Snowpark).
• SQL-first users (Analysts/DEs).
• Tools like dbt.
|
• Processing files (Images, Video, Audio).
• Large-scale historical backfills.
• Multi-modal data processing.
|
데이터 원본 |
HTTP 페이로드를 통해 전달된 작은 입력. |
Snowflake 테이블에 있는 데이터. |
Snowflake 스테이지에 있는 데이터(파일). |
확장성 |
요청 볼륨을 충족하기 위한 수평적 자동 크기 조정. |
가상 웨어하우스를 통한 서버리스 확장. |
대량 데이터에 대한 고처리량 분산 처리. |
주요 이점 |
Zero-Ops 복잡성: Snowflake는 컨테이너 오케스트레이션, 수신 및 보안 패치를 자동으로 처리합니다. |
제로 인프라: 모델을 네이티브 SQL 함수처럼 취급합니다. |
비용 최적화: 고유한 대용량 컴퓨팅 스테이지를 위한 높은 효율성을 제공합니다. |