垂直领域问答Agent建设
DataFunSummit:AIAgent峰会
明振南
小米集团技术委/小爱
2025年5月
目录
01业务背景
OPTION
02技术方案
OPTION
03落地难点
OPTION
04小结
OPTION
业务背景
小米垂直领域问答场景
?商品助手
?小米产品参数查询、商品售后客服、本机查询
?汽车问答助手
?本车设置项查询、本车状态查询、汽车手册查询、车牌交规查询
u大模型时代,RAG+LLM为这两个典型场景赋能统一采用Agent架构方案实现
业务背景
整体技术方案
档外展示此内容
暂时无法在飞书文档外展示此内容
?AgentParser模块:利用LLM做语义理解,针对业务功能场景识别输出functioncode
?AgentSkill模块:领域RAG、API接口调用、本机信号查询,组装prompt
?大模型加持:调用LLM生成结果及后处理
?知识模块:小爱RAG平台,提供专业领域的知识检索功能
技术方案介绍
AgentParser
利用大模型对query进行意图理解,输出fucntioncode
技术方案介绍
AgentSkill
在语义理解大模型functioncode基础上做结果满足
技术方案介绍
RAG检索模块
技术方案介绍
小爱通用RAG平台
知识库向量化构建
商品知识向量化在飞书文档外展示此内容
知识库向量化构建
商品知识向量化
朴素但有效:goods+attr+value书文档外展示此内容
知识库向量化构建
汽车静态知识
标题段落图片表格
?文档解析:解析说明书、、以及
?索引建设:
?各级标题的父子映射关系
?文本、图片、表格与标题的索引映射
?索引保留有序性,保障文本、图片、表格位置信息
?向量构建:block文本、标题+文本、表格表头、表格元素组合法在飞书文档外展示此内容
知识库向量化构建
汽车动态信号
?llm辅助构建检索增强文本
?TSA开关状态反馈-TSA赛道模式现在开了吗
改写模块
语义不完整指代问题信息缺失
?(/)
?q1(上轮):空调现在是多少度
?q2(当前轮):最低是多少度
语义不匹配因果推理问题用户表述纠错问题
?(/gap/)
?Q:我的后视镜有水怎么办
?A:小米汽车支持后视镜加热,你可以xx
解决方案
?基于llm做SFT任务,实现query改写
?