SharePoint 용 Openflow Connector 설정¶
참고
커넥터에는 커넥터 약관 이 적용됩니다.
이 항목에서는 SharePoint 용 Openflow Connector를 설정하는 단계를 설명합니다.
전제 조건¶
Openflow Connector for SharePoint 을 검토했는지 확인합니다.
Openflow를 설정 했는지 확인합니다.
자격 증명 받기¶
SharePoint 관리자로 다음 작업을 수행합니다.
다음 Microsoft Graph 권한이 있는 Microsoft Graph 애플리케이션이 있는지 확인합니다.
Sites.Selected: 지정된 사이트로만 액세스를 제한합니다.
Files.SelectedOperations.Selected: 지정된 사이트의 파일에 대해서만 액세스를 제한합니다.
GroupMember .Read.All: SharePoint그룹 권한을 확인하는 데 사용됩니다.
User.ReadBasic.All: Microsoft365 사용자 이메일을 확인하는 데 사용됩니다.
사용자 없이 액세스 권한 얻기에 설명된 대로 OAuth 인증을 사용하도록 SharePoint 를 구성합니다. 커넥터는 다음 Microsoft Graph APIs 를 사용하여 SharePoint 에서 데이터를 가져옵니다.
Snowflake로 수집하려는 파일 또는 폴더가 있는 Microsoft 365 SharePoint 사이트 URL 및 Azure 또는 Office 365 계정 관리자로부터 자격 증명을 받습니다.
Snowflake 계정 설정하기¶
Snowflake 계정 관리자는 수동으로 또는 아래 포함된 스크립트를 사용하여 다음 작업을 수행합니다.
새 역할을 생성하거나 기존 역할을 사용하여 데이터베이스 권한 권한을 부여합니다.
유형이 SERVICE 인 새 Snowflake 서비스 사용자를 생성합니다.
Snowflake 서비스 사용자에게 이전 단계에서 생성한 역할을 부여합니다.
2단계의 Snowflake SERVICE 사용자에 대해 키 페어 인증 으로 구성합니다.
Snowflake는 이 단계를 강력히 권장합니다. Openflow에서 지원하는 시크릿 관리자(예: AWS, Azure, Hashicorp)를 구성하고 공개 및 개인 키를 시크릿 스토어에 저장합니다.
참고
어떤 이유로든 시크릿 관리자를 사용하지 않으려면 조직의 보안 정책에 따라 키 페어 인증에 사용되는 공개 키와 개인 키 파일을 보호할 책임이 있습니다.
시크릿 관리자가 구성되면 인증 방법을 결정합니다. AWS 에서는 다른 시크릿을 유지할 필요가 없으므로 Openflow와 연결된 EC2 인스턴스 역할을 사용하는 것이 좋습니다.
Openflow에서 오른쪽 상단의 햄버거 메뉴에서 이 시크릿 관리자와 연결된 매개 변수 공급자를 구성합니다. Controller Settings » Parameter Provider 로 이동한 다음 매개 변수 값을 가져옵니다.
이 시점에서 모든 자격 증명은 연결된 매개 변수 경로로 참조할 수 있으며 민감한 값은 Openflow 내에서 유지될 필요가 없습니다.
다른 Snowflake 사용자가 커넥터에서 수집한 원시 수집 문서 및 테이블에 대한 액세스가 필요한 경우(예: Snowflake에서 사용자 정의 처리를 위해), 해당 사용자에게 1단계에서 생성한 역할을 부여하십시오.
커넥터가 사용할 웨어하우스를 지정합니다. 가장 작은 데이터 웨어하우스 크기로 시작한 다음 복제되는 테이블 수와 전송되는 데이터의 양에 따라 크기를 실험해 보십시오. 테이블 수가 많은 경우 일반적으로 더 큰 규모의 웨어하우스보다는 멀티 클러스터 웨어하우스 에서 확장이 더 쉽습니다.
예시 설정¶
--The following script assumes you'll need to create all required roles, users, and objects. --However, you may want to reuse some that are already in existence. --Create a Snowflake service user to manage the connector USE ROLE USERADMIN; CREATE USER <openflow_service_user> TYPE=SERVICE COMMENT='Service user for Openflow automation'; --Create a pair of secure keys (public and private). For more information, see --key-pair authentication. Store the private key for the user in a file to supply --to the connector’s configuration. Assign the public key to the Snowflake service user: ALTER USER <openflow_service_user> SET RSA_PUBLIC_KEY = '<pubkey>'; --Create a role to manage the connector and the associated data and --grant it to that user USE ROLE SECURITYADMIN; CREATE ROLE <openflow_connector_admin_role>; GRANT ROLE <openflow_connector_admin_role> TO USER <openflow_service_user>; --The following block is for USE CASE 2 (Cortex connect) ONLY --Create a role for read access to the cortex search service created by this connector. --This role should be granted to any role that will use the service CREATE ROLE <cortex_search_service_read_only_role>; GRANT ROLE <cortex_search_service_read_only_role> TO ROLE <whatever_roles_will_access_search_service>; --Create the database the data will be stored in and grant usage to the roles created USE ROLE ACCOUNTADMIN; --use whatever role you want to own your DB CREATE DATABASE IF NOT EXISTS <destination_database>; GRANT USAGE ON DATABASE <destination_database> TO ROLE <openflow_connector_admin_role>; --Create the schema the data will be stored in and grant the necessary privileges --on that schema to the connector admin role: USE DATABASE <destination_database>; CREATE SCHEMA IF NOT EXISTS <destination_schema>; GRANT USAGE ON SCHEMA <destination_schema> TO ROLE <openflow_connector_admin_role>; GRANT CREATE TABLE, CREATE DYNAMIC TABLE, CREATE STAGE, CREATE SEQUENCE, CREATE CORTEX SEARCH SERVICE ON SCHEMA <destination_schema> TO ROLE <openflow_connector_admin_role>; --The following block is for CASE 2 (Cortex connect) ONLY --Grant the Cortex read-only role access to the database and schema GRANT USAGE ON DATABASE <destination_database> TO ROLE <cortex_search_service_read_only_role>; GRANT USAGE ON SCHEMA <destination_schema> TO ROLE <cortex_search_service_read_only_role>; --Create the warehouse this connector will use if it doesn't already exist. Grant the --appropriate privileges to the connector admin role. Adjust the size according to your needs. CREATE WAREHOUSE <openflow_warehouse> WITH WAREHOUSE_SIZE = 'MEDIUM' AUTO_SUSPEND = 300 AUTO_RESUME = TRUE; GRANT USAGE, OPERATE ON WAREHOUSE <openflow_warehouse> TO ROLE <openflow_connector_admin_role>;Copy
사용 사례 1: 커넥터를 사용하여 파일 수집에만 사용¶
커넥터를 사용합니다.
수집된 파일에 대한 사용자 지정 처리 수행
SharePoint 파일 및 권한 수집 및 최신 상태로 유지
커넥터 설정하기¶
데이터 엔지니어는 다음 작업을 수행하여 커넥터를 구성합니다.
커넥터 설치하기¶
Openflow 개요 페이지로 이동합니다. Featured connectors 섹션에서 View more connectors 을 선택합니다.
Openflow Connector 페이지에서 커넥터를 찾아 Add to runtime 을 선택합니다.
Select runtime 대화 상자의 Available runtimes 드롭다운 목록에서 런타임을 선택합니다.
Add 를 선택합니다.
참고
커넥터를 설치하기 전에 커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성했는지 확인하십시오.
Snowflake 계정 자격 증명으로 배포를 인증하고 런타임 애플리케이션이 Snowflake 계정에 액세스할 수 있도록 허용할지 묻는 메시지가 표시되면 Allow 를 선택합니다. 커넥터 설치 프로세스를 완료하는 데 몇 분 정도 걸립니다.
Snowflake 계정 자격 증명으로 런타임에 인증합니다.
커넥터 프로세스 그룹이 추가된 Openflow 캔버스가 표시됩니다.
커넥터 구성¶
프로세스 그룹 매개 변수 채우기
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Parameters 를 선택합니다.
Sharepoint 수집 매개 변수, Sharepoint 대상 매개 변수 및 Sharepoint 소스 매개 변수 에 설명된 대로 필수 매개 변수 값을 입력합니다.
Sharepoint 소스 매개 변수¶
매개 변수 |
설명 |
---|---|
SharePoint 사이트 URL |
URL 또는 SharePoint 커넥터가 내용을 수집할 사이트 |
SharePoint 클라이언트 ID |
Microsoft Entra 클라이언트ID . 클라이언트 ID 및 Microsoft Entra에서 찾는 방법에 대한 자세한 내용은 애플리케이션 ID (클라이언트 ID) 섹션을 참조하십시오. |
SharePoint 클라이언트 시크릿 |
Microsoft Entra 클라이언트 시크릿. 클라이언트 시크릿에 대한 자세한 내용과 Microsoft Entra에서 찾는 방법은 인증서 & 시크릿 섹션을 참조하십시오. |
SharePoint 테넌트 ID |
Microsoft Entra 테넌트 ID. 테넌트 ID 및 Microsoft Entra에서 테넌트를 찾는 방법에 대한 자세한 내용은 Microsoft 365 테넌트 ID 찾기 섹션을 참조하십시오. |
Sharepoint 애플리케이션 개인 키 |
PEM 형식으로 생성된 애플리케이션 개인 키입니다. 키는 암호화되지 않은 상태여야 합니다. |
Sharepoint 사이트 도메인 |
동기화된 SharePoint 사이트의 도메인 이름입니다. |
Sharepoint 애플리케이션 인증서 |
PEM 형식으로 생성된 애플리케이션 인증서입니다. |
공유 대상 매개 변수¶
매개 변수 |
설명 |
---|---|
대상 데이터베이스 |
데이터가 유지될 데이터베이스입니다. Snowflake에 이미 존재해야 합니다 |
대상 스키마 |
데이터가 유지될 스키마입니다. Snowflake에 이미 존재해야 합니다 |
Snowflake 계정 식별자 |
Snowflake 계정 이름은 [organization-name]-[account-name] 형식으로 형식이 지정되며, 데이터는 여기에 영구적으로 저장됩니다. |
Snowflake Authentication Strategy |
Snowflake에 대한 인증 전략. 가능한 값: SNOWFLAKE_SESSION_TOKEN - SPCS 에서 플로우를 실행하는 경우, 개인 키를 사용하여 액세스를 설정하려는 경우 KEY_PAIR |
Snowflake 개인 키 |
인증에서 사용되는 RSA 개인 키입니다. RSA 키는 PKCS8 표준에 따라 형식이 지정되어야 하며 표준 PEM 헤더와 푸터가 있어야 합니다. Snowflake 개인 키 파일 또는 Snowflake 개인 키 중 하나를 정의해야 합니다 |
Snowflake 개인 키 파일 |
PKCS8 표준에 따라 형식이 지정되고 표준 PEM 헤더와 푸터가 있는 Snowflake 인증에 사용되는 RSA 개인 키가 포함된 파일입니다. 헤더 라인은 |
Snowflake 개인 키 비밀번호 |
Snowflake 개인 키 파일과 연결된 비밀번호입니다 |
Snowflake 역할 |
쿼리 실행 중에 사용되는 Snowflake 역할 |
Snowflake 사용자 이름 |
Snowflake 인스턴스에 연결하는 데 사용되는 사용자 이름입니다 |
Snowflake 웨어하우스 |
쿼리 실행에 사용되는 Snowflake 웨어하우스 |
Sharepoint 수집 매개 변수¶
매개 변수 |
설명 |
---|---|
SharePoint 사이트 그룹 사용 가능 |
사이트 그룹 기능을 사용할지 여부를 지정합니다. |
SharePoint 소스 폴더 |
이 폴더와 모든 하위 폴더에서 지원되는 파일은 Snowflake로 수집됩니다. 폴더 경로는 공유 문서 라이브러리를 기준으로 합니다. |
수집할 파일 확장자 |
수집할 파일 확장자를 지정하는 쉼표로 구분된 목록입니다. 커넥터는 가능하면 먼저 파일을 PDF 형식으로 변환하려고 시도합니다. 그럼에도 불구하고 확장자 검사는 원본 파일 확장자에 대해 수행됩니다. 변환할 수 있는 형식에 대해 알아보려면 형식 옵션 지정된 파일 확장자 중 일부가 Cortex Parse Document에서 지원되지 않는 경우 커넥터는 해당 파일을 무시하고 이벤트 로그에 경고 메시지를 기록하고 다른 파일을 계속 처리합니다. |
Sharepoint 문서 라이브러리 이름 |
파일을 수집할 SharePoint 사이트의 라이브러리입니다. |
Snowflake 파일 해시 테이블 이름 |
내용이 변경되었는지 확인하기 위해 파일 해시를 저장할 테이블의 이름입니다. 이 매개 변수는 일반적으로 변경하지 않아야 합니다. |
플로우를 실행합니다.
프로세스 그룹을 시작합니다. 이 플로우는 Snowflake 내부에 모든 필수 오브젝트를 생성합니다.
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Start 를 선택합니다.
사용 사례 2: 커넥터 정의를 사용하여 파일을 수집하고 Cortex로 처리 성능 수행하기¶
미리 정의된 플로우 정의를 사용합니다.
조직의 SharePoint 사이트 내에서 공개 문서를 위한 AI헬퍼를 만드십시오.
AI 어시스턴트가 조직의 SharePoint 사이트에 지정된 액세스 제어를 준수하도록 설정합니다.
커넥터 설정하기¶
데이터 엔지니어는 다음 작업을 수행하여 커넥터를 구성합니다.
커넥터 설치하기¶
커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성합니다. 첫 번째 단계에서 생성한 역할에 필수 데이터베이스 권한 를 부여합니다. 역할 자리 표시자를 실제 값으로 바꾸고 다음 SQL 명령을 사용합니다.
CREATE DATABASE DESTINATION_DB; CREATE SCHEMA DESTINATION_DB.DESTINATION_SCHEMA; GRANT USAGE ON DATABASE DESTINATION_DB TO ROLE <CONNECTOR_ROLE>; GRANT USAGE ON SCHEMA DESTINATION_DB.DESTINATION_SCHEMA TO ROLE <CONNECTOR_ROLE>; GRANT CREATE TABLE ON SCHEMA DESTINATION_DB.DESTINATION_SCHEMA TO ROLE <CONNECTOR_ROLE>;
Copy
Openflow 개요 페이지로 이동합니다. Featured connectors 섹션에서 View more connectors 을 선택합니다.
Openflow Connector 페이지에서 커넥터를 찾아 Add to runtime 을 선택합니다.
Select runtime 대화 상자의 Available runtimes 드롭다운 목록에서 런타임을 선택합니다.
Add 를 선택합니다.
참고
커넥터를 설치하기 전에 커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성했는지 확인하십시오.
Snowflake 계정 자격 증명으로 배포를 인증하고 런타임 애플리케이션이 Snowflake 계정에 액세스할 수 있도록 허용할지 묻는 메시지가 표시되면 Allow 를 선택합니다. 커넥터 설치 프로세스를 완료하는 데 몇 분 정도 걸립니다.
Snowflake 계정 자격 증명으로 런타임에 인증합니다.
커넥터 프로세스 그룹이 추가된 Openflow 캔버스가 표시됩니다.
커넥터 구성¶
프로세스 그룹 매개 변수 채우기
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Parameters 를 선택합니다.
Sharepoint Cortex Connect 소스 매개 변수, Sharepoint Cortex Connect 대상 매개 변수 및 Sharepoint Cortex Connect 수집 매개 변수 에 설명된 대로 필수 매개 변수 값을 입력합니다.
Sharepoint Cortex Connect 소스 매개 변수¶
매개 변수 |
설명 |
---|---|
SharePoint 사이트 URL |
URL 또는 SharePoint 커넥터가 내용을 수집할 사이트 |
SharePoint 클라이언트 ID |
Microsoft Entra 클라이언트ID . 클라이언트 ID 및 Microsoft Entra에서 찾는 방법에 대한 자세한 내용은 애플리케이션 ID (클라이언트 ID) 섹션을 참조하십시오. |
SharePoint 클라이언트 시크릿 |
Microsoft Entra 클라이언트 시크릿. 클라이언트 시크릿에 대한 자세한 내용과 Microsoft Entra에서 찾는 방법은 인증서 & 시크릿 섹션을 참조하십시오. |
SharePoint 테넌트 ID |
Microsoft Entra 테넌트 ID. 테넌트 ID 및 Microsoft Entra에서 테넌트를 찾는 방법에 대한 자세한 내용은 Microsoft 365 테넌트 ID 찾기 섹션을 참조하십시오. |
Sharepoint 애플리케이션 개인 키 |
PEM 형식으로 생성된 애플리케이션 개인 키입니다. 키는 암호화되지 않은 상태여야 합니다. |
Sharepoint 사이트 도메인 |
동기화된 SharePoint 사이트의 도메인 이름입니다. |
Sharepoint 애플리케이션 인증서 |
PEM 형식으로 생성된 애플리케이션 인증서입니다. |
Sharepoint Cortex Connect 대상 매개 변수¶
매개 변수 |
설명 |
---|---|
대상 데이터베이스 |
데이터가 유지될 데이터베이스입니다. Snowflake에 이미 존재해야 합니다 |
대상 스키마 |
데이터가 유지될 스키마입니다. Snowflake에 이미 존재해야 합니다 |
Snowflake 계정 식별자 |
Snowflake 계정 이름은 [organization-name]-[account-name] 형식으로 형식이 지정되며, 데이터는 여기에 영구적으로 저장됩니다. |
Snowflake Authentication Strategy |
Snowflake에 대한 인증 전략. 가능한 값: SNOWFLAKE_SESSION_TOKEN - SPCS 에서 플로우를 실행하는 경우, 개인 키를 사용하여 액세스를 설정하려는 경우 KEY_PAIR |
Snowflake 개인 키 |
인증에서 사용되는 RSA 개인 키입니다. RSA 키는 PKCS8 표준에 따라 형식이 지정되어야 하며 표준 PEM 헤더와 푸터가 있어야 합니다. Snowflake 개인 키 파일 또는 Snowflake 개인 키 중 하나를 정의해야 합니다 |
Snowflake 개인 키 파일 |
PKCS8 표준에 따라 형식이 지정되고 표준 PEM 헤더와 푸터가 있는 Snowflake 인증에 사용되는 RSA 개인 키가 포함된 파일입니다. 헤더 라인은 |
Snowflake 개인 키 비밀번호 |
Snowflake 개인 키 파일과 연결된 비밀번호입니다 |
Snowflake 역할 |
쿼리 실행 중에 사용되는 Snowflake 역할 |
Snowflake 사용자 이름 |
Snowflake 인스턴스에 연결하는 데 사용되는 사용자 이름입니다 |
Snowflake 웨어하우스 |
쿼리 실행에 사용되는 Snowflake 웨어하우스 |
Sharepoint Cortex Connect 수집 매개 변수¶
매개 변수 |
설명 |
---|---|
SharePoint 사이트 그룹 사용 가능 |
사이트 그룹 기능을 사용할지 여부를 지정합니다. |
SharePoint 소스 폴더 |
이 폴더와 모든 하위 폴더에서 지원되는 파일은 Snowflake로 수집됩니다. 폴더 경로는 공유 문서 라이브러리를 기준으로 합니다. |
수집할 파일 확장자 |
수집할 파일 확장자를 지정하는 쉼표로 구분된 목록입니다. 커넥터는 가능하면 먼저 파일을 PDF 형식으로 변환하려고 시도합니다. 그럼에도 불구하고 확장자 검사는 원본 파일 확장자에 대해 수행됩니다. 변환할 수 있는 형식에 대해 알아보려면 형식 옵션 지정된 파일 확장자 중 일부가 Cortex Parse Document에서 지원되지 않는 경우 커넥터는 해당 파일을 무시하고 이벤트 로그에 경고 메시지를 기록하고 다른 파일을 계속 처리합니다. |
Sharepoint 문서 라이브러리 이름 |
파일을 수집할 SharePoint 사이트의 라이브러리입니다. |
Snowflake 파일 해시 테이블 이름 |
내용이 변경되었는지 확인하기 위해 파일 해시를 저장할 테이블의 이름입니다. 이 매개 변수는 일반적으로 변경하지 않아야 합니다. |
OCR 모드 |
Cortex PARSE_DOCUMENT 함수로 파일을 구문 분석할 때 사용하는 OCR 모드입니다. 값은 |
Snowflake Cortex Search Service 사용자 역할 |
Cortex Search Service에 대한 사용 권한이 할당된 역할의 식별자입니다. |
평면을 마우스 오른쪽 버튼으로 클릭하고 Enable all Controller Services 를 선택합니다.
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Start 를 선택합니다. 커넥터가 데이터 수집을 시작합니다.
사용 사례 3: 커넥터 정의 사용자 지정하기¶
커넥터 정의를 사용자 지정합니다.
수집된 파일을 Document AI 로 처리합니다.
수집된 파일에 대해 사용자 정의 처리를 수행합니다.
커넥터 설정하기¶
데이터 엔지니어는 다음 작업을 수행하여 커넥터를 구성합니다.
커넥터 설치하기¶
Openflow 개요 페이지로 이동합니다. Featured connectors 섹션에서 View more connectors 을 선택합니다.
Openflow Connector 페이지에서 커넥터를 찾아 Add to runtime 을 선택합니다.
Select runtime 대화 상자의 Available runtimes 드롭다운 목록에서 런타임을 선택합니다.
Add 를 선택합니다.
참고
커넥터를 설치하기 전에 커넥터가 수집한 데이터를 저장할 수 있도록 Snowflake에서 데이터베이스와 스키마를 생성했는지 확인하십시오.
Snowflake 계정 자격 증명으로 배포를 인증하고 런타임 애플리케이션이 Snowflake 계정에 액세스할 수 있도록 허용할지 묻는 메시지가 표시되면 Allow 를 선택합니다. 커넥터 설치 프로세스를 완료하는 데 몇 분 정도 걸립니다.
Snowflake 계정 자격 증명으로 런타임에 인증합니다.
커넥터 프로세스 그룹이 추가된 Openflow 캔버스가 표시됩니다.
커넥터 구성¶
커넥터 정의를 사용자 지정합니다.
다음 프로세스 그룹을 제거합니다.
중복 내용 확인
Snowflake 스테이지 및 구문 분석 PDF
Snowflake Cortex 업데이트
(선택 사항) Microsoft365 그룹 처리
Process SharePoint Metadata
프로세스 그룹의 출력에 사용자 정의 처리를 첨부합니다. 각 플로우 파일은 단일 SharePoint 파일 변경을 나타냅니다.
프로세스 그룹 매개 변수를 채웁니다. 사용 사례 1과 동일한 프로세스를 따릅니다. 커넥터 정의를 수정한 후에는 모든 매개 변수가 요구되지 않을 수도 있습니다.
플로우를 실행합니다.
프로세스 그룹을 시작합니다. 이 플로우는 Snowflake 내부에 모든 필수 오브젝트를 생성합니다.
가져온 프로세스 그룹을 마우스 오른쪽 버튼으로 클릭하고 Start 를 선택합니다.
SharePoint 사이트 그룹 사용 설정하기¶
사이트 그룹용 Microsoft Graph 애플리케이션¶
자격 증명 받기 에 지정된 단계 외에 다음을 수행합니다.
Sites.Selected SharePoint 권한을 추가합니다.
참고
Microsoft Graph와 SharePoint 권한 모두에
Sites.Selected
가 표시되어야 합니다.키 페어를 생성합니다. 또는 다음 명령을 실행하여
openssl
로 자체 서명된 인증서를 생성할 수 있습니다.openssl req -x509 -nodes -newkey rsa:2048 -keyout key.pem -out cert.pem -days 365
Copy참고
위의 명령은 생성된 개인 키를 암호화하지 않습니다. 암호화된 키를 생성하려면
-nodes
인자를 제거합니다.인증서 를 Microsoft Graph 애플리케이션에 첨부합니다.
Cortex Search Service 쿼리하기¶
Cortex Search 서비스를 사용하여 SharePoint 에서 채팅하거나 문서를 쿼리할 수 있는 채팅 및 검색 애플리케이션을 구축할 수 있습니다.
커넥터를 설치 및 구성하고 Sharepoint에서 내용을 수집하기 시작하면 Cortex Search 서비스에 쿼리할 수 있습니다. Cortex Search 사용에 대한 자세한 내용은 Cortex Search Service 쿼리하기 섹션을 참조하십시오.
응답 필터링하기
특정 사용자가 SharePoint 에서 액세스할 수 있는 문서로만 Cortex Search Service의 응답을 제한하려면 Cortex Search를 쿼리할 때 ID 또는 사용자의 이메일 주소가 포함된 필터를 지정할 수 있습니다. 예를 들어, filter.@contains.user_ids
또는 filter.@contains.user_emails
. 커넥터가 생성한 Cortex Search Service의 이름은 Cortex
스키마에서 search_service
입니다.
SQL 워크시트에서 다음 SQL 코드를 실행하여 SharePoint 사이트에서 수집한 파일로 Cortex Search Service를 쿼리하십시오.
다음을 바꿉니다.
application_instance_name
: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.user_emailID
: 응답을 필터링하려는 사용자의 이메일 ID 입니다.your_question
: 응답을 받고자 하는 질문입니다.number_of_results
: 응답에서 반환할 결과의 최대 개수입니다. 최대값은 1,000이고 기본값은 10입니다.
SELECT PARSE_JSON(
SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
'<application_instance_name>.cortex.search_service',
'{
"query": "<your_question>",
"columns": ["chunk", "web_url"],
"filter": {"@contains": {"user_emails": "<user_emailID>"} },
"limit": <number_of_results>
}'
)
)['results'] AS results
columns
에 입력할 수 있는 전체 값 목록은 다음과 같습니다.
열 이름 |
타입 |
설명 |
---|---|---|
|
String |
SharePoint 사이트 문서 루트에서 파일에 대한 전체 경로입니다. 예: |
|
String |
브라우저에 원본 SharePoint 파일을 표시하는 URL. |
|
String |
항목이 가장 최근에 수정된 날짜 및 시간입니다. |
|
String |
문서의 텍스트 중 Cortex Search 쿼리와 일치하는 부분입니다. |
|
배열 |
문서에 액세스할 수 있는 Microsoft 365 사용자 IDs 의 배열입니다. 또한 문서에 할당된 모든 Microsoft 365 그룹의IDs사용자도 포함됩니다. 특정 사용자 ID 를 찾으려면, 사용자 가져오기 섹션을 참조하십시오. |
|
배열 |
문서에 액세스할 수 있는 Microsoft 365 사용자 이메일 IDs 의 배열입니다. 또한 문서에 할당된 모든 Microsoft 365 그룹의 사용자 이메일 IDs 도 포함됩니다. |
예시: AI 어시스턴트에게 인적 리소스(HR) 정보 쿼리하기
Cortex Search를 사용하여 직원들이 온보딩, 행동 강령, 팀 프로세스 및 조직 정책과 같은 최신 버전의 HR 정보에 대해 채팅할 수 있도록 AI 어시스턴트에게 쿼리할 수 있습니다. 응답 필터를 사용하여 HR 팀원이 SharePoint 에 구성된 액세스 제어를 준수하면서 직원 계약을 쿼리할 수 있도록 허용할 수도 있습니다.
SQL 워크시트 에서 다음을 실행하여 SharePoint 에서 수집한 파일로 Cortex Search Service를 쿼리합니다. 데이터베이스를 애플리케이션 인스턴스 이름으로 선택하고 스키마를 Cortex 로 선택합니다.
다음을 바꿉니다.
application_instance_name
: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.user_emailID
: 응답을 필터링하려는 사용자의 이메일 ID 입니다.
SELECT PARSE_JSON(
SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
'<application_instance_name>.cortex.search_service',
'{
"query": "What is my vacation carry over policy?",
"columns": ["chunk", "web_url"],
"filter": {"@contains": {"user_emails": "<user_emailID>"} },
"limit": 1
}'
)
)['results'] AS results
Python 워크시트 에서 다음 코드를 실행하여 SharePoint 에서 수집한 파일로 Cortex Search Service를 쿼리합니다. 데이터베이스에 snowflake.core
패키지를 추가해야 합니다.
다음을 바꿉니다.
application_instance_name
: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.user_emailID
: 응답을 필터링하려는 사용자의 이메일 ID 입니다.
import snowflake.snowpark as snowpark
from snowflake.snowpark import Session
from snowflake.core import Root
def main(session: snowpark.Session):
root = Root(session)
# fetch service
my_service = (root
.databases["<application_instance_name>"]
.schemas["cortex"]
.cortex_search_services["search_service"]
)
# query service
resp = my_service.search(
query="What is my vacation carry over policy?",
columns = ["chunk", "web_url"],
filter = {"@contains": {"user_emails": "<user_emailID>"} },
limit=1
)
return (resp.to_json())
명령줄 인터페이스에서 다음 코드를 실행하여 SharePoint 에서 수집한 파일로 Cortex Search Service를 쿼리합니다. 키 페어 인증과 OAuth 를 통해 인증해야 Snowflake REST APIs 에 접속할 수 있습니다. 자세한 내용은 Rest API 및 Snowflake를 사용하여 Snowflake REST APIs 인증하기 섹션을 참조하십시오.
다음을 바꿉니다.
application_instance_name
: 데이터베이스 및 커넥터 애플리케이션 인스턴스의 이름입니다.account_url
: Snowflake 계정의 URL. 계정 URL 찾기에 대한 지침은 계정의 조직 및 계정 이름 찾기 섹션을 참조하십시오.
curl --location "https://<account_url>/api/v2/databases/<application_instance_name>/schemas/cortex/cortex-search-services/search_service" \
--header 'Content-Type: application/json' \
--header 'Accept: application/json' \
--header "Authorization: Bearer <CORTEX_SEARCH_JWT>" \
--data '{
"query": "What is my vacation carry over policy?",
"columns": ["chunk", "web_url"],
"limit": 1
}'
샘플 응답:
{
"results" : [ {
"web_url" : "https://<domain>.sharepoint.com/sites/<site_name>/<path_to_file>",
"chunk" : "Answer to the question asked."
} ]
}