Snowpark Submit 설치하기¶
Snowflake의 인프라에서 배치 지향 Spark 워크로드를 직접 실행하기 위해 Snowpark Submit 을 설치할 수 있습니다.
Snowpark Submit 을 설치하려면 다음 단계를 완료합니다.
:code:`pip`를 사용하여 Snowpark Submit 을 설치합니다.
pip install snowpark-submit
Snowflake 인증을 위한 connections.toml 파일에 Snowflake 연결을 추가합니다. 이미 Snowflake 연결이 있는 경우 해당 연결을 사용할 수 있습니다.
connections.toml 파일이 아직 없는 경우 :ref:`label-python_connection_toml`에 설명된 대로 파일을 생성합니다.
connections.toml 파일이 있으면 Snowflake 연결을 추가할 수 있습니다. 예를 들어 ``snowpark-submit``이라는 Snowflake 연결을 추가하려면 구성 파일에 다음 줄을 추가합니다.
[snowpark-submit] host = "<account>.snowflakecomputing.com" port = 443 account = "<account>" user = "test_user" role = "test_role" password = "<password for user>" protocol = "https" warehouse = "test_warehouse" database = "test_db" schema = "test_schema" compute_pool = "test_compute_pool"
클라이언트 컴퓨터에서 Snowflake에 연결할 수 있는지 확인합니다.
클라이언트 컴퓨터에서 연결이 작동하는지 확인하려면 Snowflake에 연결하는 코드가 포함된
.py파일을 만듭니다.connection_test.py파일을 만들고 나서 다음 코드를 추가합니다.# connection_test.py code import sys import snowflake.connector conn_name = sys.argv[1] print(f"Trying connection named {conn_name}..") conn = snowflake.connector.connect(connection_name=conn_name) print("Connected.") cursor = conn.cursor() cursor.execute("SELECT 'Connection successful'") for col in cursor: print(col) print("\nListing first 5 tables:\n") cursor = conn.cursor() cursor.execute('show tables limit 5') for col in cursor: print(col) print("\nDone")
활성 Python 가상 환경에서 다음 명령을 실행하여
connections.toml파일에 추가한 연결의 이름을 지정합니다.python connection_test.py snowpark-submit
클라이언트 컴퓨터에서 Snowflake에 연결할 수 있는지 확인한 후에는 Snowpark Submit 을 사용하여 Snowflake의 인프라에서 직접 배치 지향 Spark 워크로드를 실행할 수 있습니다. Snowpark Submit 참조 섹션에서 Snowpark Submit 명령줄 참조를 참조하거나 Snowpark Submit 예 섹션에서 Snowpark Submit 사용 방법의 예제를 참조하세요.