Snowpark Submit をインストールする

Snowpark Submit をインストールすると、Snowflakeのインフラストラクチャ上でバッチ指向のSparkワークロードを直接実行できます。

|spsubmit|をインストールするには、次の手順を完了してください。

  1. pip を使用して Snowpark Submit をインストールします。

    pip install snowpark-submit
    
    Copy
  2. Snowflake認証用の connection.toml ファイルに snowpark-submit という名前の接続を追加します。

    そのようなファイルがまだない場合は、 connections.toml ファイルを使用した接続 の説明に従って作成します。

    [snowpark-submit]
    host = "<account>.snowflakecomputing.com"
    port = 443
    account = "<account>"
    user = "test_user"
    role = "test_role"
    password = "<password for user>"
    protocol = "https"
    warehouse = "test_warehouse"
    database = "test_db"
    schema = "test_schema"
    compute_pool = "test_compute_pool"
    
    Copy
  3. クライアントコンピューターからSnowflakeに接続できることを確認します。

    クライアントコンピューターからの接続が機能することを確認するには、Snowflakeに接続するコードを含む .py ファイルを作成します。

    1. connection_test.py ファイルを作成し、次のコードを追加します。

      # connection_test.py code
      
      import sys
      import snowflake.connector
      
      conn_name = sys.argv[1]
      
      print(f"Trying connection named {conn_name}..")
      conn = snowflake.connector.connect(connection_name=conn_name)
      print("Connected.")
      
      cursor = conn.cursor()
      cursor.execute("SELECT 'Connection successful'")
      for col in cursor:
          print(col)
      
      print("\nListing first 5 tables:\n")
      cursor = conn.cursor()
      cursor.execute('show tables limit 5')
      for col in cursor:
          print(col)
      print("\nDone")
      
      Copy
    2. アクティブなPython仮想環境から、 connections.toml ファイルに追加した接続の名前を指定して、次のコマンドを実行します。

      python connection_test.py snowpark-submit
      
      Copy