警惕AI“信口开河”：大语言模型幻觉控制能力深度测评报告.pdf - 创享文库

基本信息

文件名称：警惕AI“信口开河”：大语言模型幻觉控制能力深度测评报告.pdf

文件大小：948.21 KB

总页数：12 页

更新时间：2025-10-15

总字数：约1.67万字

文档摘要

警惕AI“信口开河”：大语言模型幻觉控制

能力深度测评报告

摘要

在人工智能浪潮席卷全球的背景下，大语言模型（LLM）正加速扎根知识

服务、医疗诊断、商业分析等专业领域，其应用深度与广度持续拓展。然而，一

个关键障碍始终横亘在前：“幻觉”——即输出看似逻辑自洽，实则与事实相悖

或偏离语境的现象——已成为制约其可信度的关键瓶颈。为此，香港大学蒋镇辉

教授领衔的人工智能评估实验室（AIEL），针对37个中美大语言模型（含20个

通用模型、15个推