AI 智能客服系统架构设计与实现

1. 项目概述#

本文档详细介绍一款基于检索增强生成(RAG)技术的智能客服系统的架构设计与实现方案。该系统通过自然语言处理技术,为企业提供智能化客户服务能力。

1.1 核心功能#

系统提供三大核心功能:

  • 智能问答:基于知识库的智能问答服务,支持多轮对话
  • 问题推荐:根据用户问题智能推荐相关问题,提升咨询效率
  • 知识库管理:支持批量导入问答数据,自动向量化存储

1.2 技术选型#

组件技术栈说明
后端框架FastAPI高性能异步 API 框架
向量数据库Milvus开源向量数据库,支持亿级向量检索
大语言模型Ollama / DeepSeek本地或云端 LLM 部署
EmbeddingOllama Embeddings本地 embedding 模型
RAG 框架LangChain + LangGraph检索增强生成编排
对话历史MemorySaver会话状态持久化

2. 系统架构#

2.1 系统架构#

系统采用分层架构设计,主要包含以下四层:

1. 客户端层

用户通过 Web 或 App 客户端发起 HTTP 请求,与 API 服务层进行交互。

2. API 服务层(FastAPI)

核心服务层,处理三类主要请求:

  • POST /chat - 智能问答接口,支持多轮对话
  • POST /suggest_questions - 根据用户问题推荐相关问题
  • POST /ingest_qa_csv - 批量导入问答数据到知识库

3. 机器学习层(Ollama)

阅读全文

文明6 RAG 知识库

基于文明6百科构建 RAG:路由判定、多路检索与生成,详解系统架构与核心设计。
阅读全文

微调原神角色信息

简介#

源码地址

业余时间研究了大语言模型的微调技巧,也成功微调出了一个原神的大模型

我微调的大模型要达到的效果是

问:钟离是什么性别?
答:钟离是男性

问:钟离来自什么国家?
答:钟离来自璃月

问:钟离掌握什么元素力?
答:岩元素

问:钟离的身份是什么?
答:往生堂客卿,岩神

问: 钟离的性格特点是什么?
答: 沉稳,深知璃月文化底蕴

准备事项#

python环境#

我的requirements.txt文件内容如下

transformers>=4.46.3
datasets>=3.4.1
accelerate==1.5.2
peft==0.14.0
trl==0.16.0
tokenizers==0.20.3
gradio==5.20.0
pandas==2.2.3
scipy
einops
sentencepiece
tiktoken
protobuf
uvicorn
pydantic
fastapi
sse-starlette
matplotlib==3.10.1
fire
packaging
pyyaml
numpy==1.26.4
av
librosa

安装依赖包 pip install -r requirements.txt

数据集#

我的原始数据集是从huggingface下载的,原始数据格式大致如下

{
    "丽莎": {
        "性别": "成年女性",
        "国籍": "蒙德",
        "元素力": "雷元素",
        "身份": "西风骑士团图书管理员",
        "性格特征": "喜欢挑逗人的魔法师大姐姐"
    },
    "行秋": {
        "性别": "少年男性",
        "国籍": "璃月",
        "元素力": "水元素",
        "身份": "飞云商会少爷",
        "性格特征": "行侠仗义的侠客"
    },
    "钟离": {
        "性别": "成年男性",
        "国籍": "璃月",
        "元素力": "岩元素",
        "身份": "往生堂客卿,岩神",
        "性格特征": "沉稳,深知璃月文化底蕴"
    },
    "温迪": {
        "性别": "少年男性",
        "国籍": "蒙德",
        "元素力": "风元素",
        "身份": "吟游诗人,风神",
        "性格特征": "喜欢开玩笑的轻佻少年"
    }
}

这样的数据集不能直接喂给大模型,我们需要处理,对于每一个角色,都做如下处理,以钟离为例

阅读全文