基本信息
文件名称:垂直领域问答Agent建设.pdf
文件大小:4.85 MB
总页数:20 页
更新时间:2025-05-26
总字数:约3.08千字
文档摘要

垂直领域问答Agent建设

DataFunSummit:AIAgent峰会

明振南

小米集团技术委/小爱

2025年5月

目录

01业务背景

OPTION

02技术方案

OPTION

03落地难点

OPTION

04小结

OPTION

业务背景

小米垂直领域问答场景

?商品助手

?小米产品参数查询、商品售后客服、本机查询

?汽车问答助手

?本车设置项查询、本车状态查询、汽车手册查询、车牌交规查询

u大模型时代,RAG+LLM为这两个典型场景赋能统一采用Agent架构方案实现

业务背景

整体技术方案

档外展示此内容

暂时无法在飞书文档外展示此内容

?AgentParser模块:利用LLM做语义理解,针对业务功能场景识别输出functioncode

?AgentSkill模块:领域RAG、API接口调用、本机信号查询,组装prompt

?大模型加持:调用LLM生成结果及后处理

?知识模块:小爱RAG平台,提供专业领域的知识检索功能

技术方案介绍

AgentParser

利用大模型对query进行意图理解,输出fucntioncode

技术方案介绍

AgentSkill

在语义理解大模型functioncode基础上做结果满足

技术方案介绍

RAG检索模块

技术方案介绍

小爱通用RAG平台

知识库向量化构建

商品知识向量化在飞书文档外展示此内容

知识库向量化构建

商品知识向量化

朴素但有效:goods+attr+value书文档外展示此内容

知识库向量化构建

汽车静态知识

标题段落图片表格

?文档解析:解析说明书、、以及

?索引建设:

?各级标题的父子映射关系

?文本、图片、表格与标题的索引映射

?索引保留有序性,保障文本、图片、表格位置信息

?向量构建:block文本、标题+文本、表格表头、表格元素组合法在飞书文档外展示此内容

知识库向量化构建

汽车动态信号

?llm辅助构建检索增强文本

?TSA开关状态反馈-TSA赛道模式现在开了吗

改写模块

语义不完整指代问题信息缺失

?(/)

?q1(上轮):空调现在是多少度

?q2(当前轮):最低是多少度

语义不匹配因果推理问题用户表述纠错问题

?(/gap/)

?Q:我的后视镜有水怎么办

?A:小米汽车支持后视镜加热,你可以xx

解决方案

?基于llm做SFT任务,实现query改写

?