Default to remote Kimi mode

This commit is contained in:
lutc5
2026-04-30 14:00:18 +08:00
parent e88856e1fc
commit a2f777a1a8
14 changed files with 172 additions and 66 deletions

View File

@@ -11,12 +11,14 @@
代理后端支持两种模式:
- **IPC 插件模式(默认)**连接本机 Lingma IDE 插件的 WebSocket / Named Pipe。优点是更接近 IDE 插件上下文,适合日常稳定使用
- **远端 API 模式(实验)**:读取 Lingma 本地登录缓存或显式凭据,直接调用 Lingma 远端接口。优点是不依赖 IDE 插件窗口和 IPC 会话,体验更像官方 API缺点是依赖本地登录态字段和非公开接口未来可能失效
- **远端 API 模式(默认,实验**读取 Lingma 本地登录缓存或显式凭据,直接调用 Lingma 远端接口。优点是不依赖 IDE 插件窗口和 IPC 会话,体验更像官方 API目前更推荐给 Claude Code / Hermes 这类本地 Agent
- **IPC 插件模式**:连接本机 Lingma IDE 插件的 WebSocket / Named Pipe。优点是更接近 IDE 插件上下文,适合作为兼容性兜底
## 当前版本
当前桌面端版本线:`v1.4.1`
当前桌面端版本线:`v1.4.2`
版本更新记录见 [CHANGELOG.md](./CHANGELOG.md)。
GitHub Actions 会在 Release 中产出:
@@ -235,17 +237,7 @@ lingma-ipc-proxy --transport pipe --pipe '\\.\pipe\lingma-ipc'
## 后端模式
### IPC 插件模式(默认)
IPC 模式通过本机 Lingma IDE 插件通信:
```bash
lingma-ipc-proxy --backend ipc --transport auto --port 8095
```
适合已经打开 VS Code / Lingma 插件、希望使用插件当前会话环境、并优先使用插件探测模型列表的场景。
### 远端 API 模式(实验)
### 远端 API 模式(默认,实验
远端模式直接调用 Lingma 远端接口:
@@ -297,6 +289,16 @@ lingma-ipc-proxy \
- 当前本机实测:`/health``/v1/models`、OpenAI 流式 / 非流式、Claude Code Anthropic + Bash 工具调用均可用Claude Code 完整工具链耗时明显高于简单 OpenAI 请求。
- 该模式参考了 [ZipperCode/lingma2api](https://github.com/ZipperCode/lingma2api) 对 Lingma 远端接口、签名和登录态结构的探索,本仓库将其作为可切换后端集成到现有 OpenAI / Anthropic / 桌面 App 架构中。
### IPC 插件模式
IPC 模式通过本机 Lingma IDE 插件通信:
```bash
lingma-ipc-proxy --backend ipc --transport auto --port 8095
```
适合已经打开 VS Code / Lingma 插件、希望使用插件当前会话环境、并优先使用插件探测模型列表的场景。
## 快速开始
### 前置条件
@@ -349,7 +351,7 @@ export ANTHROPIC_API_KEY="any"
然后在 Claude Code 中选择模型:
```text
/model MiniMax-M2.7
/model kmodel
```
### Cline
@@ -358,7 +360,7 @@ export ANTHROPIC_API_KEY="any"
- Base URL`http://127.0.0.1:8095/v1`
- API Key`any`
- Model ID`MiniMax-M2.7`
- Model ID`kmodel`
### Continue
@@ -368,7 +370,7 @@ export ANTHROPIC_API_KEY="any"
{
"title": "Lingma Proxy",
"provider": "openai",
"model": "MiniMax-M2.7",
"model": "kmodel",
"apiKey": "any",
"apiBase": "http://127.0.0.1:8095/v1"
}
@@ -390,7 +392,7 @@ export ANTHROPIC_API_KEY="any"
| `Qwen3-Thinking` | 推理类模型 |
| `Qwen3.6-Plus` | 通用模型 |
| `Kimi-K2.6` | 多模态和长上下文模型 |
| `MiniMax-M2.7` | 第三方 Agent 默认推荐 |
| `MiniMax-M2.7` | 速度优先备选 |
### 模型参数来源和推荐
@@ -398,13 +400,13 @@ export ANTHROPIC_API_KEY="any"
| 模型 | 推荐场景 | 参数 / 能力依据 |
| --- | --- | --- |
| `MiniMax-M2.7` | 默认推荐给 OpenClaw / Hermes / Claude Code / Cline 这类第三方 Agent | NVIDIA 的 [MiniMax M2.7 模型卡](https://developer.nvidia.com/blog/minimax-m2-7-advances-scalable-agentic-workflows-on-nvidia-platforms-for-complex-ai-applications/) 标注 200K input context、MoE 语言模型和 agentic 场景;本地代理压测 read/search/terminal/web/patch/vision 全部通过,平均延迟最低。 |
| `Kimi-K2.6` | 多模态、长上下文、复杂 Agent 工作流 | Kimi [官方 API 文档](https://platform.kimi.ai/docs/guide/kimi-k2-6-quickstart) 标注原生 text/image/video、多步工具调用和 256K 上下文。 |
| `Kimi-K2.6`(远端模式 ID 为 `kmodel` | 远端 API 模式和第三方 Agent 默认推荐 | Kimi [官方 API 文档](https://platform.kimi.ai/docs/guide/kimi-k2-6-quickstart) 标注原生 text/image/video、多步工具调用和 256K 上下文。本地 Claude Code 远端模式测试里工具执行更自然。 |
| `MiniMax-M2.7`(远端模式 ID 为 `mmodel` | 速度优先备选 | NVIDIA 的 [MiniMax M2.7 模型卡](https://developer.nvidia.com/blog/minimax-m2-7-advances-scalable-agentic-workflows-on-nvidia-platforms-for-complex-ai-applications/) 标注 200K input context、MoE 语言模型和 agentic 场景;此前本地代理压测 read/search/terminal/web/patch/vision 全部通过,响应速度较快。 |
| `Qwen3-Coder` | 代码专项和工具协议备选 | Qwen [官方博客](https://qwenlm.github.io/blog/qwen3-coder/) 标注 256K 原生上下文、可扩展到 1M以及 agentic coding / function calling 协议。 |
| `Qwen3.6-Plus` | 通用 / 视觉备选 | Lingma 暴露且本地实测可用,但本仓库没有找到 Lingma 专属的官方上下文长度来源。 |
| `Qwen3-Max` | 快速通用 / 视觉备选 | 简单工具和视觉测试表现好,但强制 read/patch 场景在本代理里不如 MiniMax / Kimi 稳。 |
当客户端请求没有携带 `model` 字段时,代理默认使用:`MiniMax-M2.7`
当客户端请求没有携带 `model` 字段时,代理默认使用:`kmodel`(远端模型列表里的 Kimi-K2.6
## 配置文件
@@ -482,7 +484,7 @@ Lingma 插件本身没有公开标准 OpenAI / Anthropic Tools 协议,所以
- 自动归一化常见工具名别名:`Bash``Shell``Read``Grep``Edit``Fetch` 等。
- Anthropic `stream=true` 且请求包含 tools 时,会先内部完成生成和重试,再流式输出最终 `tool_use` 事件,避免 Claude Code 这类客户端先收到普通拒绝文本。
本地压测结果:`MiniMax-M2.7``Kimi-K2.6``Qwen3.6-Plus``Qwen3-Coder` 均通过 read/search/terminal/web/patch/vision 烟测;其中 `MiniMax-M2.7` 平均延迟最低,所以作为默认推荐
本地压测结果:`MiniMax-M2.7``Kimi-K2.6``Qwen3.6-Plus``Qwen3-Coder` 均通过 read/search/terminal/web/patch/vision 烟测。当前默认推荐远端 API 模式的 `kmodel`,因为它不受 Lingma IDE IPC 会话限制,在 Claude Code 和 Hermes 这类本地 Agent 场景更自然
## 请求和日志观测