Default to remote Kimi mode
This commit is contained in:
@@ -11,12 +11,14 @@
|
||||
|
||||
代理后端支持两种模式:
|
||||
|
||||
- **IPC 插件模式(默认)**:连接本机 Lingma IDE 插件的 WebSocket / Named Pipe。优点是更接近 IDE 插件上下文,适合日常稳定使用。
|
||||
- **远端 API 模式(实验)**:读取 Lingma 本地登录缓存或显式凭据,直接调用 Lingma 远端接口。优点是不依赖 IDE 插件窗口和 IPC 会话,体验更像官方 API;缺点是依赖本地登录态字段和非公开接口,未来可能失效。
|
||||
- **远端 API 模式(默认,实验)**:读取 Lingma 本地登录缓存或显式凭据,直接调用 Lingma 远端接口。优点是不依赖 IDE 插件窗口和 IPC 会话,体验更像官方 API;目前更推荐给 Claude Code / Hermes 这类本地 Agent。
|
||||
- **IPC 插件模式**:连接本机 Lingma IDE 插件的 WebSocket / Named Pipe。优点是更接近 IDE 插件上下文,适合作为兼容性兜底。
|
||||
|
||||
## 当前版本
|
||||
|
||||
当前桌面端版本线:`v1.4.1`
|
||||
当前桌面端版本线:`v1.4.2`
|
||||
|
||||
版本更新记录见 [CHANGELOG.md](./CHANGELOG.md)。
|
||||
|
||||
GitHub Actions 会在 Release 中产出:
|
||||
|
||||
@@ -235,17 +237,7 @@ lingma-ipc-proxy --transport pipe --pipe '\\.\pipe\lingma-ipc'
|
||||
|
||||
## 后端模式
|
||||
|
||||
### IPC 插件模式(默认)
|
||||
|
||||
IPC 模式通过本机 Lingma IDE 插件通信:
|
||||
|
||||
```bash
|
||||
lingma-ipc-proxy --backend ipc --transport auto --port 8095
|
||||
```
|
||||
|
||||
适合已经打开 VS Code / Lingma 插件、希望使用插件当前会话环境、并优先使用插件探测模型列表的场景。
|
||||
|
||||
### 远端 API 模式(实验)
|
||||
### 远端 API 模式(默认,实验)
|
||||
|
||||
远端模式直接调用 Lingma 远端接口:
|
||||
|
||||
@@ -297,6 +289,16 @@ lingma-ipc-proxy \
|
||||
- 当前本机实测:`/health`、`/v1/models`、OpenAI 流式 / 非流式、Claude Code Anthropic + Bash 工具调用均可用;Claude Code 完整工具链耗时明显高于简单 OpenAI 请求。
|
||||
- 该模式参考了 [ZipperCode/lingma2api](https://github.com/ZipperCode/lingma2api) 对 Lingma 远端接口、签名和登录态结构的探索,本仓库将其作为可切换后端集成到现有 OpenAI / Anthropic / 桌面 App 架构中。
|
||||
|
||||
### IPC 插件模式
|
||||
|
||||
IPC 模式通过本机 Lingma IDE 插件通信:
|
||||
|
||||
```bash
|
||||
lingma-ipc-proxy --backend ipc --transport auto --port 8095
|
||||
```
|
||||
|
||||
适合已经打开 VS Code / Lingma 插件、希望使用插件当前会话环境、并优先使用插件探测模型列表的场景。
|
||||
|
||||
## 快速开始
|
||||
|
||||
### 前置条件
|
||||
@@ -349,7 +351,7 @@ export ANTHROPIC_API_KEY="any"
|
||||
然后在 Claude Code 中选择模型:
|
||||
|
||||
```text
|
||||
/model MiniMax-M2.7
|
||||
/model kmodel
|
||||
```
|
||||
|
||||
### Cline
|
||||
@@ -358,7 +360,7 @@ export ANTHROPIC_API_KEY="any"
|
||||
|
||||
- Base URL:`http://127.0.0.1:8095/v1`
|
||||
- API Key:`any`
|
||||
- Model ID:`MiniMax-M2.7`
|
||||
- Model ID:`kmodel`
|
||||
|
||||
### Continue
|
||||
|
||||
@@ -368,7 +370,7 @@ export ANTHROPIC_API_KEY="any"
|
||||
{
|
||||
"title": "Lingma Proxy",
|
||||
"provider": "openai",
|
||||
"model": "MiniMax-M2.7",
|
||||
"model": "kmodel",
|
||||
"apiKey": "any",
|
||||
"apiBase": "http://127.0.0.1:8095/v1"
|
||||
}
|
||||
@@ -390,7 +392,7 @@ export ANTHROPIC_API_KEY="any"
|
||||
| `Qwen3-Thinking` | 推理类模型 |
|
||||
| `Qwen3.6-Plus` | 通用模型 |
|
||||
| `Kimi-K2.6` | 多模态和长上下文模型 |
|
||||
| `MiniMax-M2.7` | 第三方 Agent 默认推荐 |
|
||||
| `MiniMax-M2.7` | 速度优先备选 |
|
||||
|
||||
### 模型参数来源和推荐
|
||||
|
||||
@@ -398,13 +400,13 @@ export ANTHROPIC_API_KEY="any"
|
||||
|
||||
| 模型 | 推荐场景 | 参数 / 能力依据 |
|
||||
| --- | --- | --- |
|
||||
| `MiniMax-M2.7` | 默认推荐给 OpenClaw / Hermes / Claude Code / Cline 这类第三方 Agent | NVIDIA 的 [MiniMax M2.7 模型卡](https://developer.nvidia.com/blog/minimax-m2-7-advances-scalable-agentic-workflows-on-nvidia-platforms-for-complex-ai-applications/) 标注 200K input context、MoE 语言模型和 agentic 场景;本地代理压测 read/search/terminal/web/patch/vision 全部通过,平均延迟最低。 |
|
||||
| `Kimi-K2.6` | 多模态、长上下文、复杂 Agent 工作流 | Kimi [官方 API 文档](https://platform.kimi.ai/docs/guide/kimi-k2-6-quickstart) 标注原生 text/image/video、多步工具调用和 256K 上下文。 |
|
||||
| `Kimi-K2.6`(远端模式 ID 为 `kmodel`) | 远端 API 模式和第三方 Agent 默认推荐 | Kimi [官方 API 文档](https://platform.kimi.ai/docs/guide/kimi-k2-6-quickstart) 标注原生 text/image/video、多步工具调用和 256K 上下文。本地 Claude Code 远端模式测试里工具执行更自然。 |
|
||||
| `MiniMax-M2.7`(远端模式 ID 为 `mmodel`) | 速度优先备选 | NVIDIA 的 [MiniMax M2.7 模型卡](https://developer.nvidia.com/blog/minimax-m2-7-advances-scalable-agentic-workflows-on-nvidia-platforms-for-complex-ai-applications/) 标注 200K input context、MoE 语言模型和 agentic 场景;此前本地代理压测 read/search/terminal/web/patch/vision 全部通过,响应速度较快。 |
|
||||
| `Qwen3-Coder` | 代码专项和工具协议备选 | Qwen [官方博客](https://qwenlm.github.io/blog/qwen3-coder/) 标注 256K 原生上下文、可扩展到 1M,以及 agentic coding / function calling 协议。 |
|
||||
| `Qwen3.6-Plus` | 通用 / 视觉备选 | Lingma 暴露且本地实测可用,但本仓库没有找到 Lingma 专属的官方上下文长度来源。 |
|
||||
| `Qwen3-Max` | 快速通用 / 视觉备选 | 简单工具和视觉测试表现好,但强制 read/patch 场景在本代理里不如 MiniMax / Kimi 稳。 |
|
||||
|
||||
当客户端请求没有携带 `model` 字段时,代理默认使用:`MiniMax-M2.7`。
|
||||
当客户端请求没有携带 `model` 字段时,代理默认使用:`kmodel`(远端模型列表里的 Kimi-K2.6)。
|
||||
|
||||
## 配置文件
|
||||
|
||||
@@ -482,7 +484,7 @@ Lingma 插件本身没有公开标准 OpenAI / Anthropic Tools 协议,所以
|
||||
- 自动归一化常见工具名别名:`Bash`、`Shell`、`Read`、`Grep`、`Edit`、`Fetch` 等。
|
||||
- Anthropic `stream=true` 且请求包含 tools 时,会先内部完成生成和重试,再流式输出最终 `tool_use` 事件,避免 Claude Code 这类客户端先收到普通拒绝文本。
|
||||
|
||||
本地压测结果:`MiniMax-M2.7`、`Kimi-K2.6`、`Qwen3.6-Plus`、`Qwen3-Coder` 均通过 read/search/terminal/web/patch/vision 烟测;其中 `MiniMax-M2.7` 平均延迟最低,所以作为默认推荐。
|
||||
本地压测结果:`MiniMax-M2.7`、`Kimi-K2.6`、`Qwen3.6-Plus`、`Qwen3-Coder` 均通过 read/search/terminal/web/patch/vision 烟测。当前默认推荐远端 API 模式的 `kmodel`,因为它不受 Lingma IDE IPC 会话限制,在 Claude Code 和 Hermes 这类本地 Agent 场景更自然。
|
||||
|
||||
## 请求和日志观测
|
||||
|
||||
|
||||
Reference in New Issue
Block a user