Openflow Connector for Excel 설정¶
참고
커넥터에는 커넥터 약관 이 적용됩니다.
이 항목에서는 Openflow Connector for Excel 을 설정하는 단계에 대해 설명합니다.
전제 조건¶
Openflow Connector for Excel 정보 을 검토했는지 확인합니다.
Openflow를 설정 했는지 확인합니다.
자격 증명 받기¶
이 섹션에서는 커넥터를 구성하기 위해 자격 증명을 얻는 단계에 대해 설명합니다. 데이터 소스에 따라,
AWS 자격 증명 받기¶
AWS 관리자는 다음 작업을 수행합니다.
AWS IAM 콘솔에 로그인합니다.
Users 에서 번호를 선택한 다음 Create user 를 선택합니다.
사용자 이름, 그룹 및 필요한 경우 추가 권한을 지정합니다. 사용자는 커넥터가 S3 버킷에서 읽은 오브젝트에 대한
s3:GetObject
액세스 권한이 있어야 합니다.사용자가 생성된 후 사용자 뷰에서 Security Credentials » Access Keys 로 이동합니다.
Create access key 를 선택합니다. 새 액세스 키는 특정 리소스에만 액세스 권한을 부여해야 합니다. 보안 및 액세스 제어를 보강하기 위해 특정 S3 버킷에만 액세스를 허용하는 것이 좋습니다.
Access Key 및 Secret Access Key 섹션을 참고하십시오.
Snowflake 계정 설정하기¶
Snowflake 계정 관리자는 다음 작업을 수행합니다.
새 역할을 생성하거나 기존 역할을 사용합니다.
유형이 SERVICE 인 새 Snowflake 서비스 사용자를 생성합니다.
Snowflake 서비스 사용자에게 이전 단계에서 생성한 역할을 부여합니다.
2단계의 Snowflake SERVICE 사용자에 대해 키 페어 인증 으로 구성합니다.
적극 권장 AWS, Azure, Hashicorp 등 Openflow에서 지원하는 시크릿 관리자를 구성하고 공개 키와 개인 키를 시크릿 스토어에 저장합니다.
참고
시크릿 관리자를 사용하지 않으려면 조직의 보안 정책에 따라 키 페어 인증에 사용되는 공개 키와 개인 키 파일을 보호할 책임이 있습니다.
시크릿 관리자가 구성되면 인증 방법을 결정합니다. AWS 에서는 다른 시크릿이 유지되지 않도록 Openflow와 연결된 EC2 인스턴스 역할을 사용하는 것이 좋습니다.
Openflow에서 오른쪽 상단의 햄버거 메뉴에서 이 시크릿 관리자와 연결된 Parameter Provider 를 구성합니다. Controller Settings » Parameter Provider 로 이동하여 매개 변수 값을 가져옵니다.
이 시점에서 모든 자격 증명은 연결된 매개 변수 경로로 참조할 수 있으며 민감한 값은 Openflow 내에서 유지될 필요가 없습니다.
다른 Snowflake 사용자가 커넥터에서 수집한 원시 수집 문서 및 테이블에 대한 액세스가 필요한 경우(예: Snowflake에서 사용자 정의 처리를 위해), 해당 사용자에게 1단계에서 생성한 역할을 부여하십시오.
커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성합니다. 첫 번째 단계에서 생성한 역할에 필수 데이터베이스 권한 를 부여합니다. 역할 자리 표시자를 실제 값으로 바꾸고 다음 SQL 명령을 사용합니다.
CREATE DATABASE excel_destination_db; CREATE SCHEMA excel_destination_db.excel_destination_schema; GRANT USAGE ON DATABASE excel_destination_db TO ROLE <excel_connector_role>; GRANT USAGE ON SCHEMA excel_destination_db.excel_destination_schema TO ROLE <excel_connector_role>; GRANT CREATE TABLE ON SCHEMA excel_destination_db.excel_destination_schema TO ROLE <excel_connector_role>;
커넥터가 사용할 웨어하우스를 생성하거나 기존 웨어하우스를 사용합니다. 가장 작은 데이터 웨어하우스 크기로 시작한 다음 복제되는 테이블 수와 전송되는 데이터의 양에 따라 크기를 실험해 보십시오. 테이블 수가 많은 경우 일반적으로 더 큰 규모의 웨어하우스보다는 멀티 클러스터 웨어하우스 에서 확장이 더 쉽습니다.
커넥터가 사용하는 역할이 있는 사용자에게 웨어하우스를 사용하는 데 필요한 권한이 있는지 확인합니다. 그렇지 않은 경우 해당 역할에 필수 권한을 충족하는 권한을 부여하십시오.
CREATE WAREHOUSE excel_connector_warehouse WITH WAREHOUSE_SIZE = 'X-Small'; GRANT USAGE ON WAREHOUSE excel_connector_warehouse TO ROLE <excel_connector_role>;
커넥터 설정하기¶
데이터 엔지니어는 다음 작업을 수행하여 커넥터를 설치하고 구성합니다.
커넥터 설치하기¶
Openflow 개요 페이지로 이동합니다. Featured connectors 섹션에서 View more connectors 을 선택합니다.
Openflow Connector 페이지에서 커넥터를 찾아 Add to runtime 을 선택합니다.
Select runtime 대화 상자의 Available runtimes 드롭다운 목록에서 런타임을 선택합니다.
Add 를 선택합니다.
참고
커넥터를 설치하기 전에 커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성했는지 확인하십시오.
Snowflake 계정 자격 증명으로 배포를 인증하고 런타임 애플리케이션이 Snowflake 계정에 액세스할 수 있도록 허용할지 묻는 메시지가 표시되면 Allow 를 선택합니다. 커넥터 설치 프로세스를 완료하는 데 몇 분 정도 걸립니다.
Snowflake 계정 자격 증명으로 런타임에 인증합니다.
커넥터 프로세스 그룹이 추가된 Openflow 캔버스가 표시됩니다.
커넥터 구성¶
커넥터에 필요한 모든 시크릿(예: 키 쌍 인증 및 인증서에 필요한 개인 키)을 지원되는 시크릿 관리자에서 가져오도록 커넥터를 구성합니다.
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Parameters 를 선택합니다.
플로우 매개 변수 에 설명된 대로 필수 매개 변수 값을 채웁니다.
플로우 매개 변수¶
이 섹션에서는 데이터 소스 및 매개 변수 컨텍스트에 따라 구성할 수 있는 플로우 매개 변수에 대해 설명합니다.
플로우 매개 변수: Amazon S3의 경우¶
Microsoft Excel(S3에서 Snowflake로) 수집 매개 변수¶
매개 변수 |
설명 |
필수 |
---|---|---|
대상 테이블 접두사 |
Excel 파일에서 검색된 데이터가 유지될 대상 스키마에 있는 테이블의 접두사입니다. 테이블은 커넥터에 의해 자동으로 생성됩니다. |
아니요 |
파일 비밀번호 |
Excel 파일을 보호하는 비밀번호. 보호 유형이 |
아니요 |
보호 유형 |
Excel 파일의 보호 유형. 이 값은 파일이 보호되지 않은 경우 |
예 |
범위 |
쉼표로 구분된 범위의 A1 표기법으로 값을 검색할 수 있습니다. 예: Sheet1!A1:B2,Sheet2!D4:E5,Sheet3. 선택한 범위의 첫 번째 행은 열 이름을 나타내야 합니다. 지정하지 않으면 전체 통합 문서가 수집됩니다. 지정된 범위는 |
아니요 |
S3 버킷 |
Excel 파일을 가져올 S3 버킷입니다. |
예 |
S3 오브젝트 키 |
가져올 Excel 파일이 포함된 S3 버킷 내의 쉼표로 구분된 오브젝트 키 목록입니다. 예: |
예 |
일정 |
커넥터 수집을 예약합니다. |
예 |
Microsoft Excel(S3에서 Snowflake로) 소스 매개 변수¶
매개 변수 |
설명 |
필수 |
---|---|---|
AWS 액세스 키 ID |
excel 파일을 가져오는 데 사용되는 AWS 사용자의 액세스 키 ID. |
예 |
AWS 시크릿 액세스 키 |
Excel 파일을 가져오는 데 사용되는 AWS 사용자의 시크릿 액세스 키. |
예 |
AWS 리전 |
S3 버킷이 위치한 AWS 리전. |
예 |
Microsoft Excel(S3 to Snowflake) 대상 매개 변수¶
매개 변수 |
설명 |
필수 |
---|---|---|
대상 데이터베이스 |
데이터를 수집할 Snowflake 데이터베이스의 이름(대/소문자 구분)입니다. |
예 |
대상 스키마 |
테이블이 생성될 Snowflake 스키마의 이름(대/소문자 구분)입니다. |
예 |
Snowflake 계정 식별자 |
Excel 파일에서 가져온 데이터가 유지되는 Snowflake 계정 이름은 [organization-name]-[account-name] 형식으로 지정됩니다. |
예 |
Snowflake 개인 키 |
PKCS8 표준에 따라 형식이 지정되고 표준 PEM 헤더와 푸터를 포함하는 개인 키는 키 페어 인증에 사용됩니다. |
예 |
Snowflake 개인 키 비밀번호 |
Snowflake 개인 키의 비밀번호입니다. 키가 비밀번호로 보호되지 않은 경우 값 없이 남겨 두어야 합니다. |
아니요 |
Snowflake 역할 |
커넥터에서 사용할 Snowflake 역할입니다. |
예 |
Snowflake 사용자 |
Snowflake 계정의 사용자 이름입니다. |
예 |
Snowflake 웨어하우스 |
대상 테이블에 데이터를 삽입할 때 쿼리를 실행하는 데 사용되는 데이터 웨어하우스. |
예 |
플로우 실행¶
평면을 마우스 오른쪽 버튼으로 클릭하고 Enable all Controller Services 를 선택합니다.
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Start 를 선택합니다. 커넥터가 데이터 수집을 시작합니다.
생성된 테이블 이름¶
커넥터는 {PREFIX}{FILENAME}_{RANGE}
템플릿을 사용하여 명명된 대상 테이블을 생성합니다. 이름은 항상 큰따옴표로 묶인 식별자 입니다.
{PREFIX}
는Destination Table Prefix
매개 변수의 값(예:prfx_
)으로 대체됩니다.{FILENAME}
은 수집된 파일의 전체 경로(예:file1.xlsx
또는folder/file2.xlsx
)로 대체됩니다.{RANGE}
로 대체됩니다.Ranges
매개 변수의 값이 비어 있는 경우 수집된 시트의 이름입니다.Ranges
매개 변수에 지정된 대로 수집된 범위가 있는 수집된 시트의 이름(예:Sheet1!A1:B2
)입니다.
생성된 테이블 이름의 예입니다.
"file1.xlsx_Sheet1"
"prfx_folder/file2.xlsx_Sheet1!A1:B2"
(선택 사항) 현재 실행 중인 커넥터 재구성하기¶
커넥터가 이미 데이터 수집을 시작한 후에 커넥터 매개 변수를 재구성할 수 있습니다. 수집된 파일 또는 범위를 변경해야 하는 경우 다음 단계를 수행하여 데이터가 Snowflake로 올바르게 전송되는지 확인하십시오.
커넥터 중지: 모든 Openflow 프로세서가 중지되었는지 확인합니다.
구성 설정에 액세스: Openflow 내에서 커넥터의 구성 설정으로 이동합니다.
매개 변수 수정: 필요에 따라 매개 변수를 조정하십시오.
커넥터 시작: 커넥터를 시작하고 모든 컨트롤러 서비스가 시작되었는지 확인합니다.