RAG 工作流程

检索增强生成(RAG)通过外部知识库增强 LLM 回答,解决幻觉与知识过时问题。

文档分块

推荐 chunk size 512-1024 token,overlap 10-20%。按语义边界(段落、标题)切分优于固定长度。

检索优化

结合向量检索与 BM25 关键词检索的混合方案,配合 Reranker 重排序,可显著提升召回质量。