Snowflake Collaboration Data Clean Rooms 정보¶
개요¶
Snowflake Data Clean Rooms는 Collaboration Data Clean Rooms라는 새로운 데이터 클린룸 아키텍처를 미리 보기로 제공합니다. Collaboration Data Clean Rooms를 통해 고객은 완전히 대칭적인 다자간 환경에서 공동 작업할 수 있습니다. 공동 작업자의 역할과 수를 제한하는 기존의 공급자-컨슈머 모델과 달리, Collaboration API는 다양한 참여자에 대해 유연한 역할과 세분화된 데이터 액세스 제어를 지원합니다.
공급자 및 컨슈머 데이터 클린룸과 Collaboration Data Clean Rooms 비교¶
최초의 데이터 클린룸 아키텍처인 공급자 및 컨슈머 클린룸은 주로 양자 간 공동 작업을 위해 설계되었습니다. Collaboration Data Clean Rooms는 추가적인 복잡성 없이 다자 간 공동 작업을 지원합니다. 이 새로운 설계는 공급자 및 컨슈머, 공급자 실행 분석 및 컨슈머 실행 분석, 간단한 공동 작업 및 다자 간 공동 작업의 개념을 구성 가능한 클린룸을 대체합니다. 이를 통해 모든 공동 작업자가 데이터와 템플릿을 제공하고 분석을 실행할 수 있습니다.
공급자 및 컨슈머 클린룸과 Collaboration Data Clean Rooms는 당분간 공존할 예정입니다. 공급자 및 컨슈머 클린룸은 계속 사용할 수 있으며 수정되거나 제거되지 않습니다. 그러나 새로운 Collaboration Data Clean Rooms를 사용해 보는 것이 좋습니다. 우리의 목표는 모든 사용자를 Collaboration Data Clean Rooms로 마이그레이션하여 훨씬 간단하고 강력한 공동 작업 환경을 제공하는 것입니다.
Collaboration Data Clean Rooms 소개¶
새로운 데이터 클린룸 아키텍처에서는 클린룸을 공동 작업*이라고 하며, 공동 작업에 액세스할 수 있는 모든 사용자를 *공동 작업자*라고 합니다. 각 공동 작업자는 공동 작업에서 하나 이상의 *역할*을 갖습니다. 이 경우 *역할*이라는 용어는 RBAC 역할 []이 아닌 사용자가 수행할 수 있는 작업을 정의하는 일련의 권한을 의미합니다. 공동 작업에는 다음과 같은 역할이 있습니다.
소유자: 공동 작업을 생성하고, 공동 작업자가 공동 작업에서 어떤 역할을 가질지를 결정합니다.
데이터 공급자: 지정된 분석 실행자가 사용할 수 있도록 데이터를 가져올 수 있습니다.
분석 실행자: 지정된 데이터 공급자가 제공하는 데이터 오퍼링을 사용하여 공동 작업에서 쿼리를 실행할 수 있습니다.
각 공동 작업자는 여러 역할을 가질 수 있으며, 공동 작업에는 여러 데이터 공급자와 분석 실행자가 있을 수 있지만 소유자는 한 명뿐입니다.
공동 작업에는 다양한 유형의 *리소스*가 포함될 수 있습니다.
템플릿: SQL 쿼리로 평가되는 JinjaSQL 템플릿입니다. 모든 공동 작업자는 공동 작업에 템플릿을 추가할 수 있지만, 템플릿 공급자가 지정한 분석 실행자만 템플릿을 실행할 수 있습니다.
데이터 오퍼링: 데이터 공급자가 해당 공동 작업 내의 특정 분석 실행자와 공유하는 하나 이상의 뷰 패키지입니다.
공동 작업 정의 자체는 물론, 모든 리소스는 공동 작업자가 등록한 YAML 사양 파일을 사용하여 지정됩니다. 공동 작업자는 공동 작업이 생성된 후 리소스를 추가하거나 제거할 수 있지만, 소유자가 공동 작업을 생성한 후에는 역할을 변경하거나 새 구성원을 초대할 수 없습니다.
요구 사항 및 현재 제한 사항¶
모든 계정에는 최신 버전의 |samooha-clean-room-plural|가 설치되어 있어야 합니다. 클린룸 환경을 업데이트하는 방법을 알아보세요.
소유자와 데이터 공급자는 Snowflake Enterprise Edition을 사용해야 합니다. 분석 실행자는 Standard Edition을 사용할 수 있습니다.
시스템 아키텍처¶
이 섹션에서는 Snowflake Data Clean Rooms에서 공동 작업이 수행되는 방식에 대해 간략하게 설명합니다.
다음 다이어그램은 양자 간 공동 작업을 단순화한 것입니다.
다이어그램에 대한 참고 사항:
이 다이어그램은 Data Clean Rooms Collaboration API를 사용하여 공동 작업을 생성하고 관리하는 두 공동 작업자를 보여줍니다.
공동 작업자 A는 다이어그램의 공동 작업 정의 YAML에 명시된 대로 소유자이자 생성자입니다. 공동 작업자 A는 데이터 오퍼링 공유에 명시된 대로 데이터 공급자이기도 합니다.
공동 작업자 B는 다이어그램의 데이터 오퍼링 공유에 명시된 대로 데이터 공급자입니다.
공동 작업 정의에서 허용하는 경우 A와 B 모두 분석 실행자 역할을 할 수 있습니다.
Secure Collaboration Orchestrator(SCO)는 공동 작업을 관리하는 계정입니다. SCO는 공동 작업마다 개별 앱 패키지를 생성합니다. 이 앱 패키지는 모든 잠재적 공동 작업자가 설치(참여)할 수 있는 애플리케이션입니다. 모든 공동 작업자는 DCR Collaboration API를 사용하여 공동 작업 앱과 상호 작용합니다. SCO와 관련된 비용은 사용자에게 청구되지 않습니다.
공동 작업자는 데이터 오퍼링을 생성하고, SCO는 공동 작업 정의에 따라 해당 데이터를 공동 작업자와 공유합니다. SCO는 공동 작업, 데이터 오퍼링, 템플릿 및 분석 사양을 사용하여 누가 어떤 템플릿을 사용하여 어떤 데이터에 액세스할 수 있는지, 어떤 데이터를 활성화할 수 있는지, 누구에게 활성화할 수 있는지, 그리고 자유 형식 SQL 액세스 권한을 제공할지와 같은 공동 작업 정책을 적용합니다.