一句话总结:文档驱动、需溯源、频繁更新的场景选 RAG;固定格式输出、稳定术语、风格统一的场景可考虑微调。多数企业先从 RAG 起步,微调作为增强而非替代。
对比矩阵
| 维度 | RAG | Fine-tuning |
|---|---|---|
| 知识更新 | 增删文档即可 | 需重新训练 |
| 答案溯源 | 可引用原文 | 难以溯源 |
| 成本 | 中低 | 中高(数据+算力) |
| 幻觉控制 | 检索约束强 | 依赖训练数据质量 |
| 适用 | 制度、手册、FAQ | 固定话术、分类、抽取 |
什么时候用 RAG?
- 答案在企业文档里
- 文档每月/每季度更新
- 需要「依据 XX 制度第 3 条」式引用
什么时候考虑微调?
- 输出格式极度固定(JSON schema、报告模板)
- 领域术语密集且训练集稳定(如 ICD 编码辅助)
- RAG 召回后 LLM 仍频繁格式错误
组合策略
RAG + 轻量微调:RAG 负责知识,微调优化回答结构与语气。泽衍科技在医疗、法律项目中常用此组合。
决策建议
立项时先问:「正确答案在哪里?」在文档里 → RAG;在模型行为模式里 → 微调。