大模型及DeepSeek在运维场景中的应用;
1大模型在运维领域应用前景
2面临的挑战
3若干应用场景
4总结;
行业大模型
医疗汽车教育金融工业文化/零售/交通;
大模型在运维领域应用前景
L5智能运维:实现系统自治,解放体力与脑力;
大模型在运维领域的应用前景
大语言模型是IT运维领域新质生产力的重要组成部分,推动数字化转型的颠覆式创新;
请解读上述异常日志。
DirectorstatehaschangedtoOffline.-Objectis:
000496800182:RF-3E
含义:这是一个状态变化的告警,指示一个Director(存储控制器)的状
态从在线(Online)变为离线
(Offline)。
影响:当Director离线时,相关的存储功能可能会受到影响,可能导致数据不可访问、性能下降或其他存储操作失败。
...
本次故障影响范围评估?
手机银行、柜面等交易受影响。期间成功交易量为0,上周同期交易量约244587笔。
需要生成更详尽的评估报告吗?;;;
挑战;
大模型在运维场景中的落地仍面临众多挑战
?“产品经理”思维
用户是谁
产品功能、响应速度、输入/输出、并发数的清晰界定
例如:大模型辅助的排障助手
?模型能力+软件能力
什么功能利用了大模型的什么能力
软件层面要提供哪些能力,并发、容错、上下文超限等
?融合大模型的整体系统架构
传统的软件架构、设计模式仍需考虑
?以终为始;
基于异步大模型调度的高效日志解析;
系统日志广泛用于理解系统运行状态,支持故障检测与诊断。然而,日志数据常为半结构化文本,难以直接使用。因此,常常需要首先将日志转化为结构化的“模板”+“变量”的形
式,—方面可以将日志序列简化为模板ID序列,降低分析复练度,另—方面结构化的表达形式也更便于进行统—与自动化处理分析。因此日志解析常常作为日志处理的必要前置任务。;
关键挑战
时间不—致
不同操作的速度差异,导致快速操作??迫等待,降低整体效率。
解析依赖顺序
现有方法存在顺序依赖性,对于前面日志的解析,可能会影响后面日志解析的结果,直接并行会打乱这种顺序依赖。
重复解析
相似日志同时处理,模板尚未缓存进前缀树,导致重复触发LLM调用,资源浪费。;
问题:串行执行,时间不—致
解决方案:异步并行
涉及LLM的操作统—进行异步并行执行,剩余操作包括模板匹配等,均在主流程中串行执行。在充分利用并行优势的情况下,规避不同操作时间不—致带来的延迟。;
问题:解析顺序依赖
解决方案:统—调度
当LLM调用在异步执行池中完成时,不立即进行后序处理,而是交由全局的任务管理模块进行后处理,确定其后处理顺序,以保证顺序依赖。考虑到LLM操作和代码操作的巨大时间差异,这样推迟的成本非常小。;
问题:重复解析
解决方案:任务生成管理
引入等待机制,判断解析当前日志即将生成的LLM任务是否潜在与异步执行池中已有的任务潜在重叠,如果有重叠的可能性,则让当前任务“等待”,待前序任务完成,再重新开启对于当前任务的解析。;;
基于异步大模型调度的高效日志解析方法
?EPAS准确性均高于传统方法和现有基于大模型的方法;
基于异步大模型调度的高效日志解析方法
?EPAS性能远优于现有基于大模型的方法,优于传统方法Spell;
Text2SQL;
Text2SQL技术旨在将自然语言形式的查询自动转换为数据库上的结构化查询语言(SQL)。鉴于数据库在各应用领域的广泛应用,该技术被学术界和工业界广泛关注
总体而言,Text2SQL技术路线分为两类:基于精调小模型、基于大模型;
基于大模型:Gen-SQL
o先生成再检索的范式
o利用大模型预训练过程中取得的先验知识,先根据问题猜测所需表结构,再用向量检索器召回相关表;;
?推理阶段:假如输入问题与表数据、列数据和值数据的相关度计算分别为a、b和c,那么该路径上的表分数St、列分数Sc和值分数Sv分别为:;