ストリーミング出力¶

このトピックでは、Cortex Codeエージェント SDK からリアルタイムの応答をストリーミングする方法について説明します。

デフォルトでは、モデルが各応答の生成を終了した後に SDK が完了 AssistantMessage オブジェクトを生成します。テキストと思考ブロックが生成されたときに増分更新を受け取るには、 includePartialMessages （TypeScript）または include_partial_messages （Python）を true に設定して部分的なメッセージのストリーミングを有効にします。

部分的なメッセージが有効な場合、Cortex Codeは部分的なテキストと思考オブジェクトに関する StreamEvent オブジェクトを出力します。完了したツール呼び出しは引き続き AssistantMessage オブジェクトとして到達し、ツールの結果は UserMessage オブジェクトとして引き続き到達します。

ストリーミング出力を有効にする¶

有効にすると、SDK は通常の AssistantMessage、 UserMessage および ResultMessage の各オブジェクトに加えて、部分的なストリーミングイベントを含む StreamEvent メッセージを生成します。コードが次のことを行う必要があります。

他の型と StreamEvent を区別するために、各メッセージの型を確認します。
StreamEvent の場合は、 event フィールドを抽出して type を確認します。
delta.type が text_delta である content_block_delta イベントを探します。

import { query } from "cortex-code-agent-sdk";

for await (const message of query({
  prompt: "List the files in my project",
  options: {
    cwd: process.cwd(),
    includePartialMessages: true,
    allowedTools: ["Bash", "Read"],
  },
})) {
  if (message.type === "stream_event") {
    const event = message.event;
    if (event.type === "content_block_delta") {
      if (event.delta.type === "text_delta") {
        process.stdout.write(event.delta.text);
      }
    }
  }
}

import asyncio
from cortex_code_agent_sdk import query, CortexCodeAgentOptions
from cortex_code_agent_sdk.types import StreamEvent

async def stream_response():
    async for message in query(
        prompt="List the files in my project",
        options=CortexCodeAgentOptions(
            cwd=".",
            include_partial_messages=True,
            allowed_tools=["Bash", "Read"],
        ),
    ):
        if isinstance(message, StreamEvent):
            event = message.event
            if event.get("type") == "content_block_delta":
                delta = event.get("delta", {})
                if delta.get("type") == "text_delta":
                    print(delta.get("text", ""), end="", flush=True)

asyncio.run(stream_response())

StreamEvent リファレンス¶

部分メッセージを有効にすると、オブジェクトにラップされた未加工のストリーミングイベントを受信します。

interface SDKPartialAssistantMessage {
  type: "stream_event";
  event: Record<string, unknown>;  // Raw streaming event
  parent_tool_use_id: string | null;
  uuid: string;
  session_id: string;
}

@dataclass
class StreamEvent:
    uuid: str               # Unique identifier
    session_id: str          # Session identifier
    event: dict[str, Any]    # Raw streaming event
    parent_tool_use_id: str | None  # Parent tool ID if from a subagent

event フィールドには、Cortex Codeによって出力された未加工の部分的なストリーミングイベントが含まれます。共通イベント型:


イベント型	説明
`content_block_start`	新しいテキストまたは思考ブロックの開始
`content_block_delta`	増分テキストまたは思考の更新
`content_block_stop`	現在のテキストまたは思考ブロックの終了

メッセージフロー¶

部分的なメッセージを有効にすると、通常、以下の順序でメッセージを受信します。

SystemMessage -- session initialization
StreamEvent (content_block_start) -- text or thinking block
StreamEvent (content_block_delta) -- text_delta or thinking_delta chunks...
StreamEvent (content_block_stop)
AssistantMessage -- complete text/thinking block, or complete tool_use block
UserMessage -- complete tool_result block
... more assistant/user turns ...
ResultMessage -- final result

部分的なメッセージを有効にしない場合でも、同じ完全なアシスタント、ユーザー、結果メッセージを受信しますが、 StreamEvent は受信しません。セッションに応じて、SDK は初期化、ステータス、バックグラウンドタスク通知などの system イベントを出力することもできます。

ストリームテキスト応答¶

生成されたテキストをそのまま表示するには、 delta.type が text_delta である content_block_delta イベントを探します。

import { query } from "cortex-code-agent-sdk";

for await (const message of query({
  prompt: "Explain how databases work",
  options: { cwd: process.cwd(), includePartialMessages: true },
})) {
  if (message.type === "stream_event") {
    const event = message.event;
    if (event.type === "content_block_delta" && event.delta.type === "text_delta") {
      process.stdout.write(event.delta.text);
    }
  }
}
console.log(); // Final newline

import asyncio
from cortex_code_agent_sdk import query, CortexCodeAgentOptions
from cortex_code_agent_sdk.types import StreamEvent

async def stream_text():
    async for message in query(
        prompt="Explain how databases work",
        options=CortexCodeAgentOptions(cwd=".", include_partial_messages=True),
    ):
        if isinstance(message, StreamEvent):
            event = message.event
            if event.get("type") == "content_block_delta":
                delta = event.get("delta", {})
                if delta.get("type") == "text_delta":
                    print(delta.get("text", ""), end="", flush=True)
    print()  # Final newline

asyncio.run(stream_text())

ストリーミング UI の構築¶

次の例では、ストリーミングされたテキストをローカルバッファーに蓄積し、新しい text_delta が到達するたびに現在の応答を再レンダリングしています。実際のアプリケーションでは、render 関数をフレームワークの状態更新ロジックに置き換えます。

import { query } from "cortex-code-agent-sdk";

let currentText = "";

function render(text: string) {
  console.clear();
  console.log("Assistant:\n");
  process.stdout.write(text);
}

for await (const message of query({
  prompt: "Explain how databases work",
  options: {
    cwd: process.cwd(),
    includePartialMessages: true,
  },
})) {
  if (message.type === "stream_event") {
    const event = message.event;
    if (event.type === "content_block_delta" && event.delta.type === "text_delta") {
      currentText += event.delta.text;
      render(currentText);
    }
  } else if (message.type === "result") {
    console.log("\n\n--- Complete ---");
  }
}

import asyncio
import sys
from cortex_code_agent_sdk import query, CortexCodeAgentOptions, ResultMessage
from cortex_code_agent_sdk.types import StreamEvent

def render(text: str) -> None:
    sys.stdout.write("\033[2J\033[H")
    sys.stdout.write("Assistant:\n\n")
    sys.stdout.write(text)
    sys.stdout.flush()

async def streaming_ui():
    current_text = ""

    async for message in query(
        prompt="Explain how databases work",
        options=CortexCodeAgentOptions(
            cwd=".",
            include_partial_messages=True,
        ),
    ):
        if isinstance(message, StreamEvent):
            event = message.event
            if event.get("type") == "content_block_delta":
                delta = event.get("delta", {})
                if delta.get("type") == "text_delta":
                    current_text += delta.get("text", "")
                    render(current_text)
        elif isinstance(message, ResultMessage):
            print("\n\n--- Complete ---")

asyncio.run(streaming_ui())

既知の制限¶


機能	ストリーミングへの影響
構造化出力	JSON の結果はストリーミングデルタとしてではなく、 `ResultMessage.structured_output` でのみ表示されます

法的通知¶

Cortexコードの設定が `モデルとサービスのパススルー規約<https://www.snowflake.com/en/legal/optional-offerings/offering-specific-terms/ai-features/model-pass-through-terms/>`__ において提供されるモデルを使用する場合、そのモデルの使用にはそのページにあるモデルの規約も適用されます。

インプットとアウトプットのデータ分類は以下の表の通りです。


入力データの分類	出力データの分類	指定
Usage Data	顧客データ	カバーされているAI機能[1]_

詳細については、 Snowflake AI と ML をご参照ください。