query() 提供两种模型选择模式:
- 固定模型(默认):整个会话用一个模型。
- 动态选择:每次 LLM 请求前调用回调函数返回模型。可以按用途(主对话、子代理、上下文压缩等)路由不同模型,或返回 BYOK 凭证用自己的 API Key。
固定模型
通过模型选项指定,省略时使用账号默认:动态选择
提供一个回调函数,每次 LLM 请求前都会被调用:按用途路由
不同用途用不同模型:超时
回调有默认超时(毫秒级),回调内做远程调用时可以放宽:BYOK:使用自己的 API Key
回调返回的也可以是 BYOK 凭证对象——本次请求会路由到第三方 provider:resolveModel 之前,可以先通过 CLI 校验 provider / model / API-key 组合:
null。
运行时操作
会话进行中可以拉取当前账号实时可用的模型列表:ModelInfo 还会在后端返回时携带可用状态、context_config、thinking_config 等更丰富的模型元数据。
也可以在固定模型模式下切换当前模型、拉取 BYOK provider 目录,或校验 BYOK 模型配置;具体方法签名见 SDK References。