基本信息
文件名称:警惕AI“信口开河”:大语言模型幻觉控制能力深度测评报告.pdf
文件大小:948.21 KB
总页数:12 页
更新时间:2025-10-15
总字数:约1.67万字
文档摘要

警惕AI“信口开河”:大语言模型幻觉控制

能力深度测评报告

摘要

在人工智能浪潮席卷全球的背景下,大语言模型(LLM)正加速扎根知识

服务、医疗诊断、商业分析等专业领域,其应用深度与广度持续拓展。然而,一

个关键障碍始终横亘在前:“幻觉”——即输出看似逻辑自洽,实则与事实相悖

或偏离语境的现象——已成为制约其可信度的关键瓶颈。为此,香港大学蒋镇辉

教授领衔的人工智能评估实验室(AIEL),针对37个中美大语言模型(含20个

通用模型、15个推