本地 LLM 服务

Doco Translate 支持使用本地 AI 模型在 Mac 上完全运行翻译。这保证了您的文档隐私——数据不会离开您的机器。

为什么使用本地模型？

权衡： 本地模型通常比基于云的 AI 服务产生的翻译质量更低，翻译速度取决于您 Mac 的硬件（CPU、GPU 和内存）。

Ollama 是一个流行的开源工具，用于在 macOS、Linux 和 Windows 上本地运行大语言模型。

安装 Ollama：
- 从 ollama.com 下载或通过 Homebrew 安装：
```
brew install ollama
```
拉取模型： 打开终端并运行：
```
ollama pull qwen3.6
```
翻译常用模型：
- qwen3.6 — 多语言支持强，特别是中文和亚洲语言
- llama3.2 — 通用型，速度和质量平衡良好
- gemma4 — Google 的开源模型，适合欧洲语言
启动 Ollama： Ollama 安装后自动运行。如果没有，请手动启动：
```
ollama serve
```
在 Doco Translate 中配置：
- 前往设置 → 服务 → Ollama。
- 默认主机（http://localhost:11434）应能开箱即用。
- 使用获取模型列表自动检测您已拉取的模型。
- 从下拉菜单中选择模型。
- 点击验证服务测试连接。

LM Studio 是一个桌面应用，用于通过图形界面发现、下载和运行本地 LLM。

安装 LM Studio：
- 从 lmstudio.ai 下载。
下载模型：
- 打开 LM Studio。
- 使用搜索栏查找模型（例如 qwen3.6、gemma4）。
- 在您首选的模型变体上点击下载。
启动本地服务器：
- 在 LM Studio 中，前往本地服务器选项卡（左侧边栏）。
- 选择您下载的模型。
- 点击启动服务器。
在 Doco Translate 中配置：
- 前往设置 → 服务 → LM Studio。
- 如果 LM Studio 的服务器正在运行，默认主机（http://localhost:1234）应能正常工作。
- 使用获取模型列表检测已加载的模型，或手动输入模型名称。
- 点击验证服务测试连接。

Doco Translate 中的本地服务设置与云 AI 服务类似，但有一些区别：

如果您运行的是与 OpenAI API 格式兼容的其他本地 LLM 服务器：

这适用于任何 OpenAI 兼容服务器，包括：

使用本地模型的翻译速度取决于几个因素：

建议： 从 7B–8B 模型开始，仅在质量不足时增加模型大小。将本地服务的最大并发页面数设置为 1 或 2，以避免 Mac 过载。

上一步： AI 服务 · 下一步： 自定义服务