Snowpark Submit をインストールする¶
Snowpark Submit をインストールすると、Snowflakeのインフラストラクチャ上でバッチ指向のSparkワークロードを直接実行できます。
Snowpark Submit をインストールするには、次の手順を完了してください。
pipを使用して Snowpark Submit をインストールします。pip install snowpark-submit
Snowflake認証用の:ref:`connections.toml<label-python_connection_toml>`ファイルに、Snowflake接続を追加します。既に接続設定がある場合は、その設定を使用できます。
まだ:ref:`connection.toml<label-python_connection_toml>`ファイルが無い場合は、:ref:`label-python_connection_toml`の説明に従って作成してください。
:ref:`connection.toml<label-python_connection_toml>`ファイルが用意できたら、そこにSnowflake接続を追加できます。たとえば、``snowpark-submit``というSnowflake接続を追加するには、構成ファイルに次の行を追加します。
[snowpark-submit] host = "<account>.snowflakecomputing.com" port = 443 account = "<account>" user = "test_user" role = "test_role" password = "<password for user>" protocol = "https" warehouse = "test_warehouse" database = "test_db" schema = "test_schema" compute_pool = "test_compute_pool"
クライアントコンピューターからSnowflakeに接続できることを確認します。
クライアントコンピューターからの接続が機能することを確認するには、Snowflakeに接続するコードを含む
.pyファイルを作成します。connection_test.pyファイルを作成し、次のコードを追加します。# connection_test.py code import sys import snowflake.connector conn_name = sys.argv[1] print(f"Trying connection named {conn_name}..") conn = snowflake.connector.connect(connection_name=conn_name) print("Connected.") cursor = conn.cursor() cursor.execute("SELECT 'Connection successful'") for col in cursor: print(col) print("\nListing first 5 tables:\n") cursor = conn.cursor() cursor.execute('show tables limit 5') for col in cursor: print(col) print("\nDone")
アクティブなPython仮想環境から、
connections.tomlファイルに追加した接続の名前を指定して、次のコマンドを実行します。python connection_test.py snowpark-submit
クライアントコンピューターからSnowflakeに接続できることを確認したら、|spsubmit|を使用して、バッチ指向のSparkワークロードをSnowflakeのインフラストラクチャ上で直接実行できるようになります。|spsubmit|コマンドラインリファレンスについては:doc:/developer-guide/snowpark-connect/snowpark-submit-reference、|spsubmit|の使用方法の例については:doc:`/developer-guide/snowpark-connect/snowpark-submit-examples`をご参照ください。