Snowflake Data Clean Room: Google Cloud Platform의 외부 데이터¶
Snowflake Data Clean Room 에서 분석된 데이터는 Snowflake에 기본으로 저장되거나 클라우드 공급자의 저장소에 외부에 저장되거나 두 곳 모두에 저장될 수 있습니다. 커넥터 를 사용하면 공동 작업자가 클린룸 내에서 클라우드 공급자의 외부 데이터에 액세스할 수 있습니다.
외부 데이터 커넥터는 Snowflake 외부 테이블 을 사용하여 데이터를 사용할 수 있도록 합니다. 클린룸에서 외부 테이블을 연결하면 보안 위험이 증가한다는 점에 유의하십시오. 따라서 컨슈머가 커넥터를 사용하여 외부 데이터를 포함하려면 먼저 공급자가 클린룸에서 외부 테이블 사용을 명시적으로 허용해야 합니다. 공급자가 외부 데이터 커넥터를 사용하는 경우, 컨슈머는 외부 테이블이 사용 중이라는 경고를 받고 이를 통해 클린룸 설치 여부를 결정할 수 있습니다.
이 항목에서는 클린룸 분석가가 Google Cloud Platform 버킷의 외부 데이터에 액세스할 수 있도록 커넥터를 사용하는 방법에 대해 설명합니다.
중요
Snowflake는 서드 파티 커넥터를 제공하지 않으며 추가 약관이 적용될 수 있습니다. 이러한 통합은 사용자의 편의를 위해 제공되지만, 통합을 통해 전송되거나 통합에서 수신된 모든 콘텐츠에 대한 책임은 사용자에게 있습니다.
고객은 Snowflake Data Clean Rooms 사용과 관련하여 필요한 동의를 얻을 책임이 있습니다. Snowflake Data Clean Rooms를 사용하는 경우, 활성화 목적으로 서드 파티 커넥터를 사용하는 경우를 포함하여 해당 법률 및 규정을 준수하고 있는지 확인하십시오.
전제 조건¶
외부 데이터에 커넥터를 사용하려면:
공급자는 클린룸에서 외부 테이블 사용을 명시적으로 허용 해야 합니다.
파일은 Parquet 형식이어야 합니다.
Google Cloud Platform 버킷에 연결¶
클린룸 공동 작업자가 Google Cloud Platform(GCP) 저장소의 데이터에 액세스할 수 있도록 허용하는 단계는 다음 단계로 구성됩니다.
GCP에서 GCP 버킷의 URL을 가져옵니다.
클린룸 환경에서 커넥터를 생성 합니다.
GCP에서 커넥터에 권한을 부여합니다.
클린룸 환경에서 GCP를 사용하여 커넥터를 인증 합니다.
다음 섹션에서는 이러한 단계에 대해 더 자세히 설명합니다.
GCP 버킷의 URL 가져오기¶
데이터에 액세스하려면 클린룸 커넥터에는 GCP 저장소 버킷의 URL이 필요합니다. 커넥터를 만들기 전에 다음을 수행해야 합니다.
Google Cloud Platform 콘솔에 프로젝트 편집자로 로그인합니다.
콘솔 대시보드에서 Cloud Storage » Browser 를 선택합니다.
클린룸에서 액세스하려는 데이터가 들어 있는 버킷을 선택하고 해당 데이터의 위치로 이동합니다. 버킷은 비워둘 수 없습니다.
복사 아이콘을 선택해 저장소 버킷의 URL을 복사하고 다음 작업을 위해 저장합니다.
커넥터 만들기 및 서비스 계정 식별자 복사¶
이제 클린룸 환경에서 커넥터를 생성할 준비가 되었습니다. 커넥터를 생성한 후에는 GCP의 버킷과 연결할 수 있도록 해당 서비스 계정에 대한 세부 정보를 복사해야 합니다. 클린룸 환경에서 커넥터를 생성하려면:
Snowflake Data Clean Rooms 로그인 페이지 로 이동합니다.
이메일 주소를 입력하고 Continue 를 선택합니다.
비밀번호를 입력합니다.
여러 개의 클린룸 환경과 연결되어 있는 경우, 사용할 Snowflake 계정을 선택합니다.
왼쪽 탐색에서 Connectors 를 선택한 다음 Google Cloud 섹션을 확장합니다.
Storage bucket URL 필드에서, GCP에서 복사한 URL을 입력한 다음 URL에서
https://
를gcs://
로 바꿉니다.Create 를 선택합니다. 클린룸이 GCP에 액세스하는 데 사용하는 서비스 계정을 생성합니다.
복사 아이콘을 사용하여 서비스 계정 식별자를 복사하고 다음 작업을 위해 저장합니다.
커넥터에 권한 부여¶
클린룸에는 GCP 버킷의 외부 데이터에 액세스할 수 있는 권한이 필요합니다. 이러한 권한을 부여하려면 커넥터의 서비스 계정에 대한 전용 GCP 역할을 만든 다음 서비스 계정을 GCP 버킷의 주체로 추가하면 됩니다.
커넥터의 서비스 계정에 대한 전용 GCP 역할을 만들려면:
Google Cloud Platform Console에 프로젝트 편집자로 로그인합니다.
콘솔 대시보드에서 IAM & admin » Roles 를 선택합니다.
Create Role 을 선택합니다.
역할의 이름과 설명을 입력합니다.
Add Permissions 를 선택한 후 다음 권한을 추가합니다.
storage.buckets.get
storage.objects.list
storage.objects.get
이제 전용 역할을 만들었으므로 커넥터의 서비스 계정을 GCP 버킷의 주체로 연결할 준비가 되었습니다. 서비스 계정을 연결하려면:
Google Cloud Platform 콘솔에 프로젝트 편집자로 로그인합니다.
콘솔 대시보드에서 Cloud Storage » Browser 를 선택합니다.
외부 데이터가 포함된 버킷을 선택합니다.
Show Info Panel 을 선택합니다. 정보 패널이 열립니다.
Add Principals 를 선택합니다.
New Principals 텍스트 상자에 클린룸에서 복사한 서비스 계정 식별자를 붙여넣습니다.
Select a role 드롭다운 목록에서 서비스 계정에 대해 만든 전용 역할을 선택합니다.
커넥터 인증¶
이제 커넥터가 GCP 버킷에 액세스할 수 있는지 확인하기 위해 커넥터를 인증할 준비가 되었습니다. 커넥터를 인증하려면:
클린룸의 왼쪽 탐색에서 Connectors 를 선택하고 Google Cloud 섹션을 확장합니다. 클린룸에서 로그아웃된 경우 웹 앱에 로그인합니다. 섹션을 참조하십시오.
연결할 GCP 버킷을 선택하고 Authenticate 를 선택합니다.
GCP에서 외부 데이터에 대한 액세스 제거¶
클린룸 환경에서 GCP 버킷에 대한 액세스를 제거하려면:
Snowflake Data Clean Rooms 로그인 페이지 로 이동합니다.
이메일 주소를 입력하고 Continue 를 선택합니다.
비밀번호를 입력합니다.
여러 개의 클린룸 환경과 연결되어 있는 경우, 사용할 Snowflake 계정을 선택합니다.
왼쪽 탐색에서 Connectors 를 선택한 다음 Google Cloud 섹션을 확장합니다.
현재 연결된 GCP 버킷을 찾아 휴지통 아이콘을 선택합니다.