黄锦辉:人机共存互动减少“幻觉” 提升AI可靠性-紫荆网

黄锦辉:人机共存互动减少“幻觉” 提升AI可靠性

日期:2025-07-22 浏览量: 字号:
分享到
用微信扫描二维码

| 黄锦辉

子曰:“知之为知之,不知为不知,是知也。”(《论语·为政》)意思是指:当人面对问题时,若是知道答案便表示知道,但若然不知道便坦然承认不知道,这才是真正的智慧。时至今天,笔者认为这句话也适用于“人工智能”(AI)世界。

随著近年ChatGPT、DeepSeek等人工智能模型相继面世,“生成式人工智能”(Generative Artificial Intelligence, GenAI)技术及应用风靡全球,而“可靠性”(Reliability)是研发“生成式人工智能”的“关键成功因素”(Critical Success Factor, CSP)。粗糙的GenAI在应用时很容易产生“幻觉”(Hallucination),经常答非所问,深度影响其可靠性。“幻觉”是人工智能背后“大数据”(Big Data)模型所产生的错误或误导性结果。这类错误可能由许多因素造成,包括训练资料不足、模型的假设有误、或是用来训练模型的资料存在偏误。要理解“幻觉”的影响,我们必须“回归基础”(Back to Basics),认识“大数据”的基本原理。

人工智能系统是以“大数据”驱动,并利用“深度学习”(Deep Learning)建模研发而成。例如,“生成式人工智能”技术背后的“大型语言模型”(Large Language Model, LLM)便是透过海量的训练数据产生而成的。根据“计算机科学”(Computer Science)的基本原理,“垃圾入、垃圾出”(Garbage in, Garbage Out)。因此数据的质量对人工智能效能尤其关键,当中焦点落在如何维护“大数据”5V的特性,来训练出一个负责任的“智能机械人”:

“数量”(Volume)——在“深度学习”过程中,所采用的训练数据理论上是愈多愈好,目的是扩阔目标系统(即“智能机械人”)的视野和见识,令它如博士一样“博学多才”;若然数据不足,系统难免会以偏概全(Over Generalisation)。

“速度”(Velocity)——人工智能要不停学习,以维持自身对“时事”(Current Event)认知的适时性(Timely)功能;否则系统便未能与时并进,所作出的回应(输出)往往会不合时宜(Out-of-date)。

“多样性”(Variety)——真实世界的数据五花八门,有些人使用文字和图像,也有些使用语言和录像等不同载体来表达讯息,“深度学习”必须能够交叉处理、融会贯通各样载体的讯息;反之,若然生搬硬套,独立处理各载体的讯息,便会产生“谷仓效应”(Silo Effect),分析问题时不够立体,回应不尽不实(Uncertainty)。

“价值”(Value)——人工智能模型训练面对的数据量惊人,所以要从“大数据集”中找出一条有价值的讯息,有如大海捞针、绝非容易。“机器学习”(Machine Learning, ML)算法一般以统计学理论为主导,倾向选择训练数据集中出现次数较多的“事件”(Event)。因此出现较少的便容易被忽略,结果令“智能机械人”存有偏见(Bias)。

“真实性”(Veracity)——网上虚假资讯层出不穷(例如谣言、假新闻),但深度学习一般难以有效辨别是非真伪,影响系统的可信性(Trustworthiness)。

满足上述5V的大条件是研发可靠GenAI的系统要素,但这任务所需要的资源不菲,对企业造成一定的经济负担。所以,不少公司(尤其是中小型企业SME)在采用GenAI技术时都会移船就磡,放松对5V的要求,例如因为数据收集困难而减少数据量,又例如因数据更新过程复杂而减低更新率。然而,公司“缩皮”必然会影响所生成的“大型语言模型”的质素及效率,增加了“幻觉”出现的可能性。

理论上,GenAI能够满足5V的需求只是“知之为知之”(Know the Knowns)。而在GenAI应用中,“知”(Knowns)及“不知”(Unknowns)的讯息共存自然不过,但问题出现于系统是否知晓,能够体现(承认)“不知为不知”(Don’t Know the Unknowns)。

若然可以的话,系统便能适当地拒绝具“不知”讯息的“指示”(Prompt)要求,在分析及推理过程中灵活地“避重就轻”。

但在现实商业社会中,不少“缩皮”、粗制滥造的GenAI系统却不懂得“不知为不知”,罔顾其所不知,而信口开河,牛头不对马嘴。

正因如此,系统最终会沦为一个“非‘是知也’”(无智慧)、充满“幻觉”的“机械人”。这现象亦难免会动摇人类对人工智能技术的“可靠性”之信心。

最后,孟子曰:“尽信书不如无书”,意思是指不必拘泥于书本上的内容,强调独立思考的重要性。同样地,我们在应用GenAI时,也不应该不假思索,尽信系统回应,而应该推行“人类参与循环”(Human-in-the-Loop, HITL),审视GenAI生成的结果,让人类和“机械人”在这世界中互动共生。

(作者系全国政协委员、香港立法会议员,文章仅代表作者个人观点)

扫描二维码分享到手机

五一假期开启返程模式 全国铁路、公路进入返程高峰
投资界春晚来袭!2025巴菲特股东大会五大焦点全梳理
陈茂波:致力打造新海滨 推动无处不旅游
外籍游客、外语导游、外国博主……多视角讲述“China travel”独特记忆
紫荆杂志
影响有影响力的人