SharePoint 용 Openflow Connector 설정¶

참고

This connector is subject to the Snowflake Connector Terms.

이 항목에서는 SharePoint 용 Openflow Connector를 설정하는 단계를 설명합니다.

전제 조건¶

Openflow Connector for SharePoint 정보 을 검토했는지 확인합니다.
Ensure that you have Openflow - BYOC 설정 or Set up Openflow - Snowflake Deployments.
|OFSFSPCS-plural|를 사용하는 경우 필수 도메인 구성</user-guide/data-integration/openflow/setup-openflow-spcs-sf-allow-list>`을 검토했는지와 :ref:`label-openflow_domains_used_by_openflow_connectors_sharepoint 커넥터의 필수 도메인에 대한 액세스 권한을 부여했는지 확인합니다.

자격 증명 받기¶

SharePoint 관리자로 다음 작업을 수행합니다.

Ensure that you have a Microsoft Graph application with the appropriate Microsoft Graph permissions based on your use case:

ACL 커넥터의 경우:
1. Sites.Selected: 지정된 사이트로만 액세스를 제한합니다.
2. Files.SelectedOperations.Selected: 지정된 사이트의 파일에 대해서만 액세스를 제한합니다.
3. GroupMember .Read.All: SharePoint그룹 권한을 확인하는 데 사용됩니다.
4. User.ReadBasic.All:Microsoft365 사용자 이메일을 확인하는 데 사용됩니다.
비 ACL 커넥터의 경우:
1. Sites.Selected: 지정된 사이트로만 액세스를 제한합니다.
2. Files.SelectedOperations.Selected: 지정된 사이트의 파일에 대해서만 액세스를 제한합니다.
참고

비 ACL 커넥터는 사용자 권한이나 그룹 정보를 가져오지 않으므로 GroupMember.Read.All 및 User.ReadBasic.All 권한이 필요하지 않습니다.
사용자 없이 액세스 권한 얻기에 설명된 대로 OAuth 인증을 사용하도록 SharePoint 를 구성합니다. 커넥터는 다음 Microsoft Graph APIs 를 사용하여 SharePoint 에서 데이터를 가져옵니다.
Snowflake로 수집하려는 파일 또는 폴더가 있는 Microsoft 365 SharePoint 사이트 URL 및 Azure 또는 Office 365 계정 관리자로부터 자격 증명을 받습니다.

Snowflake 계정 설정하기¶

Snowflake 계정 관리자는 수동으로 또는 아래 포함된 스크립트를 사용하여 다음 작업을 수행합니다.

새 역할을 생성하거나 기존 역할을 사용하여 데이터베이스 권한 권한을 부여합니다.
유형이 SERVICE 인 새 Snowflake 서비스 사용자를 생성합니다.
Snowflake 서비스 사용자에게 이전 단계에서 생성한 역할을 부여합니다.
2단계의 Snowflake SERVICE 사용자에 대해 키 페어 인증 으로 구성합니다.
Snowflake는 이 단계를 강력히 권장합니다. Openflow에서 지원하는 시크릿 관리자(예: AWS, Azure, Hashicorp)를 구성하고 공개 및 개인 키를 시크릿 스토어에 저장합니다.

참고

어떤 이유로든 시크릿 관리자를 사용하지 않으려면 조직의 보안 정책에 따라 키 페어 인증에 사용되는 공개 키와 개인 키 파일을 보호할 책임이 있습니다.
1. 시크릿 관리자가 구성되면 인증 방법을 결정합니다. AWS 에서는 다른 시크릿을 유지할 필요가 없으므로 Openflow와 연결된 EC2 인스턴스 역할을 사용하는 것이 좋습니다.
2. Openflow에서 오른쪽 상단의 햄버거 메뉴에서 이 시크릿 관리자와 연결된 매개 변수 공급자를 구성합니다. Controller Settings » Parameter Provider 로 이동한 다음 매개 변수 값을 가져옵니다.
3. 이 시점에서 모든 자격 증명은 연결된 매개 변수 경로로 참조할 수 있으며 민감한 값은 Openflow 내에서 유지될 필요가 없습니다.
다른 Snowflake 사용자가 커넥터에서 수집한 원시 수집 문서 및 테이블에 대한 액세스가 필요한 경우(예:Snowflake에서 사용자 정의 처리를 위해), 해당 사용자에게 1단계에서 생성한 역할을 부여하십시오.
커넥터가 사용할 웨어하우스를 지정합니다. 가장 작은 데이터 웨어하우스 크기로 시작한 다음 복제되는 테이블 수와 전송되는 데이터의 양에 따라 크기를 실험해 보십시오. 테이블 수가 많은 경우 일반적으로 더 큰 규모의 웨어하우스보다는 멀티 클러스터 웨어하우스 에서 확장이 더 쉽습니다.

예시 설정¶

--The following script assumes you'll need to create all required roles, users, and objects.
--However, you may want to reuse some that are already in existence.

--Create a Snowflake service user to manage the connector
USE ROLE USERADMIN;
CREATE USER <openflow_service_user> TYPE=SERVICE COMMENT='Service user for Openflow automation';

--Create a pair of secure keys (public and private). For more information, see
--key-pair authentication. Store the private key for the user in a file to supply
--to the connector’s configuration. Assign the public key to the Snowflake service user:
ALTER USER <openflow_service_user> SET RSA_PUBLIC_KEY = '<pubkey>';


--Create a role to manage the connector and the associated data and
--grant it to that user
USE ROLE SECURITYADMIN;
CREATE ROLE <openflow_connector_admin_role>;
GRANT ROLE <openflow_connector_admin_role> TO USER <openflow_service_user>;


--The following block is for USE CASE 2 (Cortex connect) ONLY
--Create a role for read access to the cortex search service created by this connector.
--This role should be granted to any role that will use the service
CREATE ROLE <cortex_search_service_read_only_role>;
GRANT ROLE <cortex_search_service_read_only_role> TO ROLE <whatever_roles_will_access_search_service>;

--Create the database the data will be stored in and grant usage to the roles created
USE ROLE ACCOUNTADMIN; --use whatever role you want to own your DB
CREATE DATABASE IF NOT EXISTS <destination_database>;
GRANT USAGE ON DATABASE <destination_database> TO ROLE <openflow_connector_admin_role>;

--Create the schema the data will be stored in and grant the necessary privileges
--on that schema to the connector admin role:
USE DATABASE <destination_database>;
CREATE SCHEMA IF NOT EXISTS <destination_schema>;
GRANT USAGE ON SCHEMA <destination_schema> TO ROLE <openflow_connector_admin_role>;
GRANT CREATE TABLE, CREATE DYNAMIC TABLE, CREATE STAGE, CREATE SEQUENCE, CREATE CORTEX
SEARCH SERVICE ON SCHEMA <destination_schema> TO ROLE <openflow_connector_admin_role>;

--The following block is for CASE 2 (Cortex connect) ONLY
--Grant the Cortex read-only role access to the database and schema
GRANT USAGE ON DATABASE <destination_database> TO ROLE <cortex_search_service_read_only_role>;
GRANT USAGE ON SCHEMA <destination_schema> TO ROLE <cortex_search_service_read_only_role>;

--Create the warehouse this connector will use if it doesn't already exist. Grant the
--appropriate privileges to the connector admin role. Adjust the size according to your needs.
CREATE WAREHOUSE <openflow_warehouse>
WITH
   WAREHOUSE_SIZE = 'MEDIUM'
   AUTO_SUSPEND = 300
   AUTO_RESUME = TRUE;
GRANT USAGE, OPERATE ON WAREHOUSE <openflow_warehouse> TO ROLE <openflow_connector_admin_role>;

Copy

Use case 1: Ingest files only¶

Use a connector to:

Snowflake 내에서 사용자 지정 처리를 위해 Sharepoint 파일을 수집하고 지속적으로 업데이트
선택적으로 파일 권한(ACL 커넥터)을 수집하여 다운스트림 액세스 제어 유지

커넥터 설정하기¶

데이터 엔지니어는 다음 작업을 수행하여 커넥터를 구성합니다.

커넥터 설치하기¶

Openflow 개요 페이지로 이동합니다. Featured connectors 섹션에서 View more connectors 을 선택합니다.
Openflow Connector 페이지에서 커넥터를 찾아 Add to runtime 을 선택합니다.
Select runtime 대화 상자의 Available runtimes 드롭다운 목록에서 런타임을 선택합니다.
Add 를 선택합니다.

참고

커넥터를 설치하기 전에 커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성했는지 확인하십시오.
Snowflake 계정 자격 증명으로 배포를 인증하고 런타임 애플리케이션이 Snowflake 계정에 액세스할 수 있도록 허용할지 묻는 메시지가 표시되면 Allow 를 선택합니다. 커넥터 설치 프로세스를 완료하는 데 몇 분 정도 걸립니다.
Snowflake 계정 자격 증명으로 런타임에 인증합니다.

커넥터 프로세스 그룹이 추가된 Openflow 캔버스가 표시됩니다.

커넥터 구성¶

프로세스 그룹 매개 변수 채우기
1. 가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Parameters 를 선택합니다.
2. Sharepoint 수집 매개 변수, Sharepoint 대상 매개 변수 및 Sharepoint 소스 매개 변수 에 설명된 대로 필수 매개 변수 값을 입력합니다.

Sharepoint 소스 매개 변수¶

모든 커넥터의 경우:

매개 변수	설명
SharePoint 사이트 URL	URL 또는 SharePoint 커넥터가 내용을 수집할 사이트
SharePoint 클라이언트 ID	Microsoft Entra 클라이언트ID . 클라이언트 ID 및 Microsoft Entra에서 찾는 방법에 대한 자세한 내용은 애플리케이션 ID (클라이언트 ID) 섹션을 참조하십시오.
SharePoint 클라이언트 시크릿	Microsoft Entra 클라이언트 시크릿. 클라이언트 시크릿에 대한 자세한 내용과 Microsoft Entra에서 찾는 방법은 인증서 & 시크릿 섹션을 참조하십시오.
SharePoint 테넌트 ID	Microsoft Entra 테넌트 ID. 테넌트 ID 및 Microsoft Entra에서 테넌트를 찾는 방법에 대한 자세한 내용은 Microsoft 365 테넌트 ID 찾기 섹션을 참조하십시오.

ACL 커넥터만 해당:

매개 변수	설명
Sharepoint 애플리케이션 개인 키	PEM 형식으로 생성된 애플리케이션 개인 키입니다. 키는 암호화되지 않은 상태여야 합니다.
Sharepoint 사이트 도메인	동기화된 SharePoint 사이트의 도메인 이름입니다.
Sharepoint 애플리케이션 인증서	PEM 형식으로 생성된 애플리케이션 인증서입니다.

공유 대상 매개 변수¶

매개 변수	설명	필수
대상 데이터베이스	데이터가 유지될 데이터베이스입니다. Snowflake에 이미 존재해야 합니다. 이름은 대소문자를 구분합니다. 따옴표로 묶지 않은 식별자의 경우 이름을 대문자로 입력합니다.	예
대상 스키마	데이터가 유지될 스키마로, Snowflake에 이미 존재해야 합니다. 이름은 대소문자를 구분합니다. 따옴표로 묶지 않은 식별자의 경우 이름을 대문자로 입력합니다. 다음 예제를 참조하세요. `CREATE SCHEMA SCHEMA_NAME` 또는 `CREATE SCHEMA schema_name`: `SCHEMA_NAME` 사용 `CREATE SCHEMA "schema_name"` 또는 `CREATE SCHEMA "SCHEMA_NAME"`: 각각 `schema_name` 또는 `SCHEMA_NAME` 사용	예
Snowflake 계정 식별자	사용하는 경우: Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: 데이터가 유지될 [organization-name]-[account-name] 형식의 Snowflake 계정 이름입니다.	예
Snowflake Authentication Strategy	사용하는 경우: Snowflake Openflow Deployment 또는 BYOC: SNOWFLAKE_SESSION_TOKEN 을 사용합니다. 이 토큰은 Snowflake에서 자동으로 관리됩니다. BYOC 배포에서 SNOWFLAKE_SESSION_TOKEN을 사용하도록 :ref:`런타임 역할<label-deployment_byoc_setup_runtime_role>`을 미리 구성했어야 합니다. BYOC: Alternatively BYOC can use KEY_PAIR as the value for authentication strategy.	예
Snowflake 개인 키	사용하는 경우: Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: 인증에서 사용되는 RSA 개인 키여야 합니다. The RSA key must be formatted according to PKCS8 standards and have standard PEM headers and footers. Note that either a Snowflake Private Key File or a Snowflake Private Key must be defined.	아니요
Snowflake 개인 키 파일	사용하는 경우: Session token authentication strategy: 개인 키 파일은 비워 두어야 합니다. KEY_PAIR: PKCS8 표준에 따라 형식이 지정되고 표준 PEM 머리글과 바닥글을 포함하며 Snowflake 인증에 사용되는 RSA 개인 키를 포함하는 파일을 업로드합니다. 머리글 라인은 ``—–BEGIN PRIVATE``으로 시작합니다. 개인 키 파일을 업로드하려면 Reference asset 확인란을 선택합니다.	아니요
Snowflake 개인 키 비밀번호	사용하는 경우 Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: Snowflake 개인 키 파일과 연결된 비밀번호를 입력합니다.	아니요
Snowflake 역할	사용하는 경우 Session Token Authentication Strategy: 런타임 역할을 사용합니다. 런타임에 대한 :ui:`View Details`로 이동하여 Openflow UI에서 런타임 역할을 찾을 수 있습니다. KEY_PAIR Authentication Strategy: 서비스 사용자에 대해 구성된 유효한 역할을 사용합니다.	예
Snowflake 사용자 이름	사용하는 경우 Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: Snowflake 인스턴스에 연결하는 데 사용되는 사용자 이름을 입력합니다.	예
Snowflake 웨어하우스	쿼리 실행에 사용되는 Snowflake 웨어하우스입니다.	예

Sharepoint 수집 매개 변수¶

모든 커넥터의 경우:

매개 변수	설명
SharePoint 소스 폴더	이 폴더와 모든 하위 폴더에서 지원되는 파일은 Snowflake로 수집됩니다. 폴더 경로는 공유 문서 라이브러리를 기준으로 합니다.
수집할 파일 확장자	수집할 파일 확장자를 지정하는 쉼표로 구분된 목록입니다. 커넥터는 가능하면 먼저 파일을 PDF 형식으로 변환하려고 시도합니다. 그럼에도 불구하고 확장자 검사는 원본 파일 확장자에 대해 수행됩니다. 변환할 수 있는 형식에 대해 알아보려면 형식 옵션 지정된 파일 확장자 중 일부가 Cortex Parse Document에서 지원되지 않는 경우 커넥터는 해당 파일을 무시하고 이벤트 로그에 경고 메시지를 기록하고 다른 파일을 계속 처리합니다.
Sharepoint 문서 라이브러리 이름	파일을 수집할 SharePoint 사이트의 라이브러리입니다.
Snowflake 파일 해시 테이블 이름	내용이 변경되었는지 확인하기 위해 파일 해시를 저장할 테이블의 이름입니다. 이 매개 변수는 일반적으로 변경하지 않아야 합니다.

ACL 커넥터만 해당:

매개 변수	설명
SharePoint 사이트 그룹 사용 가능	사이트 그룹 기능을 사용할지 여부를 지정합니다.

플로우를 실행합니다.
1. 프로세스 그룹을 시작합니다. 이 플로우는 Snowflake 내부에 모든 필수 오브젝트를 생성합니다.
2. 가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Start 를 선택합니다.

Use case 2: Ingest files and perform processing with Cortex¶

미리 정의된 플로우 정의를 사용합니다.

Create AI assistants for documents within your organization’s SharePoint site
Enable your AI assistants to adhere to access controls specified in your organization’s SharePoint site

커넥터 설정하기¶

데이터 엔지니어는 다음 작업을 수행하여 커넥터를 구성합니다.

커넥터 설치하기¶

커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성합니다. 첫 번째 단계에서 생성한 역할에 필수 데이터베이스 권한 를 부여합니다. 역할 자리 표시자를 실제 값으로 바꾸고 다음 SQL 명령을 사용합니다.

CREATE DATABASE DESTINATION_DB;
CREATE SCHEMA DESTINATION_DB.DESTINATION_SCHEMA;
GRANT USAGE ON DATABASE DESTINATION_DB TO ROLE <CONNECTOR_ROLE>;
GRANT USAGE ON SCHEMA DESTINATION_DB.DESTINATION_SCHEMA TO ROLE <CONNECTOR_ROLE>;
GRANT CREATE TABLE ON SCHEMA DESTINATION_DB.DESTINATION_SCHEMA TO ROLE <CONNECTOR_ROLE>;

Copy

Openflow 개요 페이지로 이동합니다. Featured connectors 섹션에서 View more connectors 을 선택합니다.
Openflow Connector 페이지에서 커넥터를 찾아 Add to runtime 을 선택합니다.
Select runtime 대화 상자의 Available runtimes 드롭다운 목록에서 런타임을 선택합니다.
Add 를 선택합니다.

참고

커넥터를 설치하기 전에 커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성했는지 확인하십시오.
Snowflake 계정 자격 증명으로 배포를 인증하고 런타임 애플리케이션이 Snowflake 계정에 액세스할 수 있도록 허용할지 묻는 메시지가 표시되면 Allow 를 선택합니다. 커넥터 설치 프로세스를 완료하는 데 몇 분 정도 걸립니다.
Snowflake 계정 자격 증명으로 런타임에 인증합니다.

커넥터 프로세스 그룹이 추가된 Openflow 캔버스가 표시됩니다.

커넥터 구성¶

프로세스 그룹 매개 변수 채우기
1. 가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Parameters 를 선택합니다.
2. Sharepoint Cortex Connect 소스 매개 변수, Sharepoint Cortex Connect 대상 매개 변수 및 Sharepoint Cortex Connect 수집 매개 변수 에 설명된 대로 필수 매개 변수 값을 입력합니다.

Sharepoint Cortex Connect 소스 매개 변수¶

모든 커넥터의 경우:

매개 변수	설명
SharePoint 사이트 URL	URL 또는 SharePoint 커넥터가 내용을 수집할 사이트
SharePoint 클라이언트 ID	Microsoft Entra 클라이언트ID . 클라이언트 ID 및 Microsoft Entra에서 찾는 방법에 대한 자세한 내용은 애플리케이션 ID (클라이언트 ID) 섹션을 참조하십시오.
SharePoint 클라이언트 시크릿	Microsoft Entra 클라이언트 시크릿. 클라이언트 시크릿에 대한 자세한 내용과 Microsoft Entra에서 찾는 방법은 인증서 & 시크릿 섹션을 참조하십시오.
SharePoint 테넌트 ID	Microsoft Entra 테넌트 ID. 테넌트 ID 및 Microsoft Entra에서 테넌트를 찾는 방법에 대한 자세한 내용은 Microsoft 365 테넌트 ID 찾기 섹션을 참조하십시오.

ACL 커넥터만 해당:

매개 변수	설명
Sharepoint 애플리케이션 개인 키	PEM 형식으로 생성된 애플리케이션 개인 키입니다. 키는 암호화되지 않은 상태여야 합니다.
Sharepoint 사이트 도메인	동기화된 SharePoint 사이트의 도메인 이름입니다.
Sharepoint 애플리케이션 인증서	PEM 형식으로 생성된 애플리케이션 인증서입니다.

Sharepoint Cortex Connect 대상 매개 변수¶

매개 변수	설명	필수
대상 데이터베이스	데이터가 유지될 데이터베이스입니다. Snowflake에 이미 존재해야 합니다. 이름은 대소문자를 구분합니다. 따옴표로 묶지 않은 식별자의 경우 이름을 대문자로 입력합니다.	예
대상 스키마	데이터가 유지될 스키마로, Snowflake에 이미 존재해야 합니다. 이름은 대소문자를 구분합니다. 따옴표로 묶지 않은 식별자의 경우 이름을 대문자로 입력합니다. 다음 예제를 참조하세요. `CREATE SCHEMA SCHEMA_NAME` 또는 `CREATE SCHEMA schema_name`: `SCHEMA_NAME` 사용 `CREATE SCHEMA "schema_name"` 또는 `CREATE SCHEMA "SCHEMA_NAME"`: 각각 `schema_name` 또는 `SCHEMA_NAME` 사용	예
Snowflake 계정 식별자	사용하는 경우: Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: 데이터가 유지될 [organization-name]-[account-name] 형식의 Snowflake 계정 이름입니다.	예
Snowflake Authentication Strategy	사용하는 경우: Snowflake Openflow Deployment 또는 BYOC: SNOWFLAKE_SESSION_TOKEN 을 사용합니다. 이 토큰은 Snowflake에서 자동으로 관리됩니다. BYOC 배포에서 SNOWFLAKE_SESSION_TOKEN을 사용하도록 :ref:`런타임 역할<label-deployment_byoc_setup_runtime_role>`을 미리 구성했어야 합니다. BYOC: Alternatively BYOC can use KEY_PAIR as the value for authentication strategy.	예
Snowflake 개인 키	사용하는 경우: Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: 인증에서 사용되는 RSA 개인 키여야 합니다. The RSA key must be formatted according to PKCS8 standards and have standard PEM headers and footers. Note that either a Snowflake Private Key File or a Snowflake Private Key must be defined.	아니요
Snowflake 개인 키 파일	사용하는 경우: Session token authentication strategy: 개인 키 파일은 비워 두어야 합니다. KEY_PAIR: PKCS8 표준에 따라 형식이 지정되고 표준 PEM 머리글과 바닥글을 포함하며 Snowflake 인증에 사용되는 RSA 개인 키를 포함하는 파일을 업로드합니다. 머리글 라인은 ``—–BEGIN PRIVATE``으로 시작합니다. 개인 키 파일을 업로드하려면 Reference asset 확인란을 선택합니다.	아니요
Snowflake 개인 키 비밀번호	사용하는 경우 Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: Snowflake 개인 키 파일과 연결된 비밀번호를 입력합니다.	아니요
Snowflake 역할	사용하는 경우 Session Token Authentication Strategy: 런타임 역할을 사용합니다. 런타임에 대한 :ui:`View Details`로 이동하여 Openflow UI에서 런타임 역할을 찾을 수 있습니다. KEY_PAIR Authentication Strategy: 서비스 사용자에 대해 구성된 유효한 역할을 사용합니다.	예
Snowflake 사용자 이름	사용하는 경우 Session Token Authentication Strategy: 비워 두어야 합니다. KEY_PAIR: Snowflake 인스턴스에 연결하는 데 사용되는 사용자 이름을 입력합니다.	예
Snowflake 웨어하우스	쿼리 실행에 사용되는 Snowflake 웨어하우스입니다.	예

Sharepoint Cortex Connect 수집 매개 변수¶

모든 커넥터의 경우:

매개 변수	설명
SharePoint 소스 폴더	이 폴더와 모든 하위 폴더에서 지원되는 파일은 Snowflake로 수집됩니다. 폴더 경로는 공유 문서 라이브러리를 기준으로 합니다.
수집할 파일 확장자	수집할 파일 확장자를 지정하는 쉼표로 구분된 목록입니다. 커넥터는 가능하면 먼저 파일을 PDF 형식으로 변환하려고 시도합니다. 그럼에도 불구하고 확장자 검사는 원본 파일 확장자에 대해 수행됩니다. 변환할 수 있는 형식에 대해 알아보려면 형식 옵션 지정된 파일 확장자 중 일부가 Cortex Parse Document에서 지원되지 않는 경우 커넥터는 해당 파일을 무시하고 이벤트 로그에 경고 메시지를 기록하고 다른 파일을 계속 처리합니다.
Sharepoint 문서 라이브러리 이름	파일을 수집할 SharePoint 사이트의 라이브러리입니다.
Snowflake 파일 해시 테이블 이름	내용이 변경되었는지 확인하기 위해 파일 해시를 저장할 테이블의 이름입니다. 이 매개 변수는 일반적으로 변경하지 않아야 합니다.
OCR 모드	AISQL AI_PARSE_DOCUMENT 함수로 파일을 구문 분석할 때 사용하는 OCR 모드입니다. 값은 `OCR` 또는 `LAYOUT` 입니다. `OCR` 모드에서는 형식과 테이블 구조를 무시하고 원시 텍스트 내용만 추출됩니다. `LAYOUT` 모드에서 출력은 테이블 구조를 마크다운으로 유지합니다.
Snowflake Cortex Search Service 사용자 역할	Cortex Search Service에 대한 사용 권한이 할당된 역할의 식별자입니다.

ACL 커넥터만 해당:

매개 변수	설명
SharePoint 사이트 그룹 사용 가능	사이트 그룹 기능을 사용할지 여부를 지정합니다.

평면을 마우스 오른쪽 버튼으로 클릭하고 Enable all Controller Services 를 선택합니다.
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Start 를 선택합니다. 커넥터가 데이터 수집을 시작합니다.
Cortex Search Service 쿼리하기.

사용 사례 3: 커넥터 정의 사용자 지정하기¶

커넥터 정의를 사용자 지정합니다.

수집된 파일을 Document AI 로 처리합니다.
수집된 파일에 대해 사용자 정의 처리를 수행합니다.

커넥터 설정하기¶

데이터 엔지니어는 다음 작업을 수행하여 커넥터를 구성합니다.

커넥터 설치하기¶

Openflow 개요 페이지로 이동합니다. Featured connectors 섹션에서 View more connectors 을 선택합니다.
Openflow Connector 페이지에서 커넥터를 찾아 Add to runtime 을 선택합니다.
Select runtime 대화 상자의 Available runtimes 드롭다운 목록에서 런타임을 선택합니다.
Add 를 선택합니다.

참고

커넥터를 설치하기 전에 커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성했는지 확인하십시오.
Snowflake 계정 자격 증명으로 배포를 인증하고 런타임 애플리케이션이 Snowflake 계정에 액세스할 수 있도록 허용할지 묻는 메시지가 표시되면 Allow 를 선택합니다. 커넥터 설치 프로세스를 완료하는 데 몇 분 정도 걸립니다.
Snowflake 계정 자격 증명으로 런타임에 인증합니다.

커넥터 프로세스 그룹이 추가된 Openflow 캔버스가 표시됩니다.

커넥터 구성¶

커넥터 정의를 사용자 지정합니다.
1. 다음 프로세스 그룹을 제거합니다.
  - 중복 내용 확인
  - Snowflake 스테이지 및 구문 분석 PDF
  - Snowflake Cortex 업데이트
  - (선택 사항) Microsoft365 그룹 처리
2. Process SharePoint Metadata 프로세스 그룹의 출력에 사용자 정의 처리를 첨부합니다. 각 플로우 파일은 단일 SharePoint 파일 변경을 나타냅니다.
프로세스 그룹 매개 변수를 채웁니다. 사용 사례 1과 동일한 프로세스를 따릅니다. 커넥터 정의를 수정한 후에는 모든 매개 변수가 요구되지 않을 수도 있습니다.
플로우를 실행합니다.
1. 프로세스 그룹을 시작합니다. 이 플로우는 Snowflake 내부에 모든 필수 오브젝트를 생성합니다.
2. 가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Start 를 선택합니다.
Cortex Search Service 쿼리하기.

SharePoint 사이트 그룹 사용 설정하기¶

사이트 그룹용 Microsoft Graph 애플리케이션¶

자격 증명 받기 에 지정된 단계 외에 다음을 수행합니다.

Sites.Selected SharePoint 권한을 추가합니다.

참고

Microsoft Graph와 SharePoint 권한 모두에 Sites.Selected 가 표시되어야 합니다.
키 페어를 생성합니다. 또는 다음 명령을 실행하여 openssl 로 자체 서명된 인증서를 생성할 수 있습니다.
```
openssl req -x509 -nodes -newkey rsa:2048 -keyout key.pem -out cert.pem -days 365
```
Copy
참고

위의 명령은 생성된 개인 키를 암호화하지 않습니다. 암호화된 키를 생성하려면 -nodes 인자를 제거합니다.
인증서 를 Microsoft Graph 애플리케이션에 첨부합니다.

Cortex Search Service 쿼리하기¶

Cortex Search 서비스를 사용하여 SharePoint 에서 채팅하거나 문서를 쿼리할 수 있는 채팅 및 검색 애플리케이션을 구축할 수 있습니다.

커넥터를 설치 및 구성하고 Sharepoint에서 내용을 수집하기 시작하면 Cortex Search 서비스에 쿼리할 수 있습니다. Cortex Search 사용에 대한 자세한 내용은 Cortex Search Service 쿼리하기 섹션을 참조하십시오.

응답 필터링하기

특정 사용자가 SharePoint 에서 액세스할 수 있는 문서로만 Cortex Search Service의 응답을 제한하려면 Cortex Search를 쿼리할 때 ID 또는 사용자의 이메일 주소가 포함된 필터를 지정할 수 있습니다. 예를 들어, filter.@contains.user_ids 또는 filter.@contains.user_emails. 커넥터가 생성한 Cortex Search Service의 이름은 Cortex 스키마에서 search_service 입니다.

SQL 워크시트에서 다음 SQL 코드를 실행하여 SharePoint 사이트에서 수집한 파일로 Cortex Search Service를 쿼리하십시오.

다음을 바꿉니다.

application_instance_name: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.
user_emailID: 응답을 필터링하려는 사용자의 이메일 ID 입니다.
your_question: 응답을 받고자 하는 질문입니다.
number_of_results: 응답에서 반환할 결과의 최대 개수입니다. 최대값은 1,000이고 기본값은 10입니다.

SELECT PARSE_JSON(
  SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
    '<application_instance_name>.cortex.search_service',
      '{
        "query": "<your_question>",
         "columns": ["chunk", "web_url"],
         "filter": {"@contains": {"user_emails": "<user_emailID>"} },
         "limit": <number_of_results>
       }'
   )
)['results'] AS results

Copy

columns 에 입력할 수 있는 전체 값 목록은 다음과 같습니다.

모든 커넥터의 경우:

열 이름	타입	설명
`full_name`	String	SharePoint 사이트 문서 루트에서 파일에 대한 전체 경로입니다. 예: `folder_1/folder_2/file_name.pdf`.
`web_url`	String	브라우저에 원본 SharePoint 파일을 표시하는 URL.
`last_modified_date_time`	String	항목이 가장 최근에 수정된 날짜 및 시간입니다.
`chunk`	String	문서의 텍스트 중 Cortex Search 쿼리와 일치하는 부분입니다.

ACL 커넥터만 해당:

열 이름	타입	설명
`user_ids`	배열	문서에 액세스할 수 있는 Microsoft 365 사용자 IDs 의 배열입니다. 또한 문서에 할당된 모든 Microsoft 365 그룹의IDs사용자도 포함됩니다. 특정 사용자 ID 를 찾으려면, 사용자 가져오기 섹션을 참조하십시오.
`user_emails`	배열	문서에 액세스할 수 있는 Microsoft 365 사용자 이메일 IDs 의 배열입니다. 또한 문서에 할당된 모든 Microsoft 365 그룹의 사용자 이메일 IDs 도 포함됩니다.

예시: AI 어시스턴트에게 인적 리소스(HR) 정보 쿼리하기

Cortex Search를 사용하여 직원들이 온보딩, 행동 강령, 팀 프로세스 및 조직 정책과 같은 최신 버전의 HR 정보에 대해 채팅할 수 있도록 AI 어시스턴트에게 쿼리할 수 있습니다. 응답 필터를 사용하여 HR 팀원이 SharePoint 에 구성된 액세스 제어를 준수하면서 직원 계약을 쿼리할 수 있도록 허용할 수도 있습니다.

SQL 워크시트 에서 다음을 실행하여 SharePoint 에서 수집한 파일로 Cortex Search Service를 쿼리합니다. 데이터베이스를 애플리케이션 인스턴스 이름으로 선택하고 스키마를 Cortex 로 선택합니다.

다음을 바꿉니다.

application_instance_name: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.
user_emailID: 응답을 필터링하려는 사용자의 이메일 ID 입니다.

SELECT PARSE_JSON(
     SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
          '<application_instance_name>.cortex.search_service',
          '{
             "query": "What is my vacation carry over policy?",
             "columns": ["chunk", "web_url"],
             "filter": {"@contains": {"user_emails": "<user_emailID>"} },
             "limit": 1
          }'
     )
 )['results'] AS results

Copy

Python 워크시트 에서 다음 코드를 실행하여 SharePoint 에서 수집한 파일로 Cortex Search Service를 쿼리합니다. 데이터베이스에 snowflake.core 패키지를 추가해야 합니다.

다음을 바꿉니다.

application_instance_name: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.
user_emailID: 응답을 필터링하려는 사용자의 이메일 ID 입니다.

import snowflake.snowpark as snowpark
from snowflake.snowpark import Session
from snowflake.core import Root

def main(session: snowpark.Session):

   root = Root(session)

   # fetch service
   my_service = (root
     .databases["<application_instance_name>"]
     .schemas["cortex"]
     .cortex_search_services["search_service"]
   )

   # query service
   resp = my_service.search(
     query="What is my vacation carry over policy?",
     columns = ["chunk", "web_url"],
     filter = {"@contains": {"user_emails": "<user_emailID>"} },
     limit=1
   )
   return (resp.to_json())

Copy

명령줄 인터페이스에서 다음 코드를 실행하여 SharePoint 에서 수집한 파일로 Cortex Search Service를 쿼리합니다. 키 페어 인증과 OAuth 를 통해 인증해야 Snowflake REST APIs 에 접속할 수 있습니다. 자세한 내용은 REST API 및 Snowflake를 사용하여 Snowflake REST APIs 인증하기 섹션을 참조하십시오.

다음을 바꿉니다.

application_instance_name: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.
account_url: Snowflake 계정의 URL. 계정 URL 찾기에 대한 지침은 계정의 조직 및 계정 이름 찾기 섹션을 참조하십시오.

curl --location "https://<account_url>/api/v2/databases/<application_instance_name>/schemas/cortex/cortex-search-services/search_service" \
     --header 'Content-Type: application/json' \
     --header 'Accept: application/json' \
     --header "Authorization: Bearer <CORTEX_SEARCH_JWT>" \
     --data '{
         "query": "What is my vacation carry over policy?",
         "columns": ["chunk", "web_url"],
         "limit": 1
     }'

Copy

샘플 응답:

{
  "results" : [ {
  "web_url" : "https://<domain>.sharepoint.com/sites/<site_name>/<path_to_file>",
  "chunk" : "Answer to the question asked."
  } ]
}

스테이징에서 파일 찾기¶

스테이징에 저장된 파일에 읽을 수 없는 이름이 있을 수 있습니다. 특정 파일을 찾으려면 메타데이터 테이블을 신뢰할 수 출처로 사용합니다. 이 테이블들은 파일 이름과 스테이징 내 해당 파일 IDs 간의 매핑을 포함합니다.

Cortex 지원 설정에 다음 쿼리를 사용하여 파일을 찾습니다.

SELECT DISTINCT METADATA:id FROM DOCS_CHUNKS WHERE METADATA:fullName LIKE '%<file_name>%';

Copy

Cortex가 아닌 환경에서는 다음 쿼리를 사용합니다.

SELECT FILE_ID FROM DOC_METADATA WHERE FILE_NAME = '<file_name>';

Copy

:samp:`<file_name>`을 찾고 있는 파일의 이름 또는 부분 이름으로 대체합니다.

스테이지의 파일은 이러한 쿼리에서 반환된 ID로 시작합니다.