Default to remote Kimi mode

2026-04-30 14:00:18 +08:00
parent e88856e1fc
commit a2f777a1a8
14 changed files with 172 additions and 66 deletions
--- a/README.zh-CN.md
+++ b/README.zh-CN.md
@@ -11,12 +11,14 @@

 代理后端支持两种模式：

- **IPC 插件模式（默认）**：连接本机 Lingma IDE 插件的 WebSocket / Named Pipe。优点是更接近 IDE 插件上下文，适合日常稳定使用。
- **远端 API 模式（实验）**：读取 Lingma 本地登录缓存或显式凭据，直接调用 Lingma 远端接口。优点是不依赖 IDE 插件窗口和 IPC 会话，体验更像官方 API；缺点是依赖本地登录态字段和非公开接口，未来可能失效。
+- **远端 API 模式（默认，实验）**：读取 Lingma 本地登录缓存或显式凭据，直接调用 Lingma 远端接口。优点是不依赖 IDE 插件窗口和 IPC 会话，体验更像官方 API；目前更推荐给 Claude Code / Hermes 这类本地 Agent。
+- **IPC 插件模式**：连接本机 Lingma IDE 插件的 WebSocket / Named Pipe。优点是更接近 IDE 插件上下文，适合作为兼容性兜底。

 ## 当前版本

-当前桌面端版本线：`v1.4.1`
+当前桌面端版本线：`v1.4.2`
+
+版本更新记录见 [CHANGELOG.md](./CHANGELOG.md)。

 GitHub Actions 会在 Release 中产出：

@@ -235,17 +237,7 @@ lingma-ipc-proxy --transport pipe --pipe '\\.\pipe\lingma-ipc'

 ## 后端模式

-### IPC 插件模式（默认）
-
-IPC 模式通过本机 Lingma IDE 插件通信：
-
-```bash
-lingma-ipc-proxy --backend ipc --transport auto --port 8095
-```
-
-适合已经打开 VS Code / Lingma 插件、希望使用插件当前会话环境、并优先使用插件探测模型列表的场景。
-
-### 远端 API 模式（实验）
+### 远端 API 模式（默认，实验）

 远端模式直接调用 Lingma 远端接口：

@@ -297,6 +289,16 @@ lingma-ipc-proxy \
 - 当前本机实测：`/health`、`/v1/models`、OpenAI 流式 / 非流式、Claude Code Anthropic + Bash 工具调用均可用；Claude Code 完整工具链耗时明显高于简单 OpenAI 请求。
 - 该模式参考了 [ZipperCode/lingma2api](https://github.com/ZipperCode/lingma2api) 对 Lingma 远端接口、签名和登录态结构的探索，本仓库将其作为可切换后端集成到现有 OpenAI / Anthropic / 桌面 App 架构中。

+### IPC 插件模式
+
+IPC 模式通过本机 Lingma IDE 插件通信：
+
+```bash
+lingma-ipc-proxy --backend ipc --transport auto --port 8095
+```
+
+适合已经打开 VS Code / Lingma 插件、希望使用插件当前会话环境、并优先使用插件探测模型列表的场景。
+
 ## 快速开始

 ### 前置条件
@@ -349,7 +351,7 @@ export ANTHROPIC_API_KEY="any"
 然后在 Claude Code 中选择模型：

 ```text
-/model MiniMax-M2.7
+/model kmodel
 ```

 ### Cline
@@ -358,7 +360,7 @@ export ANTHROPIC_API_KEY="any"

 - Base URL：`http://127.0.0.1:8095/v1`
 - API Key：`any`
- Model ID：`MiniMax-M2.7`
+- Model ID：`kmodel`

 ### Continue

@@ -368,7 +370,7 @@ export ANTHROPIC_API_KEY="any"
    {
      "title": "Lingma Proxy",
      "provider": "openai",
-      "model": "MiniMax-M2.7",
+      "model": "kmodel",
      "apiKey": "any",
      "apiBase": "http://127.0.0.1:8095/v1"
    }
@@ -390,7 +392,7 @@ export ANTHROPIC_API_KEY="any"
 | `Qwen3-Thinking` | 推理类模型 |
 | `Qwen3.6-Plus` | 通用模型 |
 | `Kimi-K2.6` | 多模态和长上下文模型 |
-| `MiniMax-M2.7` | 第三方 Agent 默认推荐 |
+| `MiniMax-M2.7` | 速度优先备选 |

 ### 模型参数来源和推荐

@@ -398,13 +400,13 @@ export ANTHROPIC_API_KEY="any"

 | 模型 | 推荐场景 | 参数 / 能力依据 |
 | --- | --- | --- |
-| `MiniMax-M2.7` | 默认推荐给 OpenClaw / Hermes / Claude Code / Cline 这类第三方 Agent | NVIDIA 的 [MiniMax M2.7 模型卡](https://developer.nvidia.com/blog/minimax-m2-7-advances-scalable-agentic-workflows-on-nvidia-platforms-for-complex-ai-applications/) 标注 200K input context、MoE 语言模型和 agentic 场景；本地代理压测 read/search/terminal/web/patch/vision 全部通过，平均延迟最低。 |
-| `Kimi-K2.6` | 多模态、长上下文、复杂 Agent 工作流 | Kimi [官方 API 文档](https://platform.kimi.ai/docs/guide/kimi-k2-6-quickstart) 标注原生 text/image/video、多步工具调用和 256K 上下文。 |
+| `Kimi-K2.6`（远端模式 ID 为 `kmodel`） | 远端 API 模式和第三方 Agent 默认推荐 | Kimi [官方 API 文档](https://platform.kimi.ai/docs/guide/kimi-k2-6-quickstart) 标注原生 text/image/video、多步工具调用和 256K 上下文。本地 Claude Code 远端模式测试里工具执行更自然。 |
+| `MiniMax-M2.7`（远端模式 ID 为 `mmodel`） | 速度优先备选 | NVIDIA 的 [MiniMax M2.7 模型卡](https://developer.nvidia.com/blog/minimax-m2-7-advances-scalable-agentic-workflows-on-nvidia-platforms-for-complex-ai-applications/) 标注 200K input context、MoE 语言模型和 agentic 场景；此前本地代理压测 read/search/terminal/web/patch/vision 全部通过，响应速度较快。 |
 | `Qwen3-Coder` | 代码专项和工具协议备选 | Qwen [官方博客](https://qwenlm.github.io/blog/qwen3-coder/) 标注 256K 原生上下文、可扩展到 1M，以及 agentic coding / function calling 协议。 |
 | `Qwen3.6-Plus` | 通用 / 视觉备选 | Lingma 暴露且本地实测可用，但本仓库没有找到 Lingma 专属的官方上下文长度来源。 |
 | `Qwen3-Max` | 快速通用 / 视觉备选 | 简单工具和视觉测试表现好，但强制 read/patch 场景在本代理里不如 MiniMax / Kimi 稳。 |

-当客户端请求没有携带 `model` 字段时，代理默认使用：`MiniMax-M2.7`。
+当客户端请求没有携带 `model` 字段时，代理默认使用：`kmodel`（远端模型列表里的 Kimi-K2.6）。

 ## 配置文件

@@ -482,7 +484,7 @@ Lingma 插件本身没有公开标准 OpenAI / Anthropic Tools 协议，所以
 - 自动归一化常见工具名别名：`Bash`、`Shell`、`Read`、`Grep`、`Edit`、`Fetch` 等。
 - Anthropic `stream=true` 且请求包含 tools 时，会先内部完成生成和重试，再流式输出最终 `tool_use` 事件，避免 Claude Code 这类客户端先收到普通拒绝文本。

-本地压测结果：`MiniMax-M2.7`、`Kimi-K2.6`、`Qwen3.6-Plus`、`Qwen3-Coder` 均通过 read/search/terminal/web/patch/vision 烟测；其中 `MiniMax-M2.7` 平均延迟最低，所以作为默认推荐。
+本地压测结果：`MiniMax-M2.7`、`Kimi-K2.6`、`Qwen3.6-Plus`、`Qwen3-Coder` 均通过 read/search/terminal/web/patch/vision 烟测。当前默认推荐远端 API 模式的 `kmodel`，因为它不受 Lingma IDE IPC 会话限制，在 Claude Code 和 Hermes 这类本地 Agent 场景更自然。

 ## 请求和日志观测