1. 项目概述#
本文档详细介绍一款基于检索增强生成(RAG)技术的智能客服系统的架构设计与实现方案。该系统通过自然语言处理技术,为企业提供智能化客户服务能力。
1.1 核心功能#
系统提供三大核心功能:
- 智能问答:基于知识库的智能问答服务,支持多轮对话
- 问题推荐:根据用户问题智能推荐相关问题,提升咨询效率
- 知识库管理:支持批量导入问答数据,自动向量化存储
1.2 技术选型#
| 组件 | 技术栈 | 说明 |
|---|---|---|
| 后端框架 | FastAPI | 高性能异步 API 框架 |
| 向量数据库 | Milvus | 开源向量数据库,支持亿级向量检索 |
| 大语言模型 | Ollama / DeepSeek | 本地或云端 LLM 部署 |
| Embedding | Ollama Embeddings | 本地 embedding 模型 |
| RAG 框架 | LangChain + LangGraph | 检索增强生成编排 |
| 对话历史 | MemorySaver | 会话状态持久化 |
2. 系统架构#
2.1 系统架构#
系统采用分层架构设计,主要包含以下四层:
1. 客户端层
用户通过 Web 或 App 客户端发起 HTTP 请求,与 API 服务层进行交互。
2. API 服务层(FastAPI)
核心服务层,处理三类主要请求:
POST /chat- 智能问答接口,支持多轮对话POST /suggest_questions- 根据用户问题推荐相关问题POST /ingest_qa_csv- 批量导入问答数据到知识库
3. 机器学习层(Ollama)