人工智能早于上世纪五十年代于美国面世。1956年一班权威科学家在美国「达特茅斯会议」(Dartmouth Workshop)聚首,会议中首次制定人工智能研究计划。计划的目标是鼓励电脑科学界着力研发能够拥有人类智能的机器(软硬件)。可是经过60多年的努力,机器代人的目标离开现实还是有点距离。今天人工智能的通用性仍然偏低,只可以在特定领域及重复性极高的任务上派其用场,实际上应用范围颇为局限。
《三字经》云:「玉不琢,不成器 ;人不学,不知义」,不论怎样,机器要模仿人类必须首先懂得学习。因此,「机器学习」是人工智能的核心技术,而且电脑科学界一直精益求精,努力不懈地把这技术强化。上世纪由于软硬件设施的限制,「机器学习」技术的进展缓慢,影响了人工智能的发展。不过,近10年随着软件(例如深度学习,Deep Learning, DL)及硬件(例如图形处理器,Graphic Processing Unit, GPU)科技的突飞猛进,人工智能的功能得以大大提升,其应用亦日益普及,图像处理、语音识别、自然语言处理等商业应用像雨后春荀般涌现,全球无处不在。然而在商言商,企业家往往为了尽快把产品及服务推出市场会不惜一切,罔顾「机器学习」中的一些技术盲点。此举会影响产品及服务的质量,增加用户在使用时的安全风险。
孔子《论语.为政》道:「学而不思则罔,思而不学则殆。」从软件工程角度而言,一套高效的人工智能系统设计是不能单凭既定规则(Rule-based)的,不然的话所造出来的系统的覆盖率便会很低,影响系统的可靠性。因此,先进的人工智能系统都是建于「机器学习」,这结论与上述观点不谋而合。然而,过程中机器不能只顾「硬学习」,对所学的知识不求甚解,面对错误的知识仍「照单全收」。这陋习正是今天大行其道之「深度学习」技术的通病。简单而言,「深度学习」是以「黑盒」(即不透明)方式作业,为输入和输出进行配对,做法只计效果而并没有探究配对成功的原因。可惜商人一般都急功近利,只顾尽快把产品推出市场而忽略这技术上的漏洞,导致产品的功能大受影响(「罔」),可靠性受损。晋朝哲学家傅玄在《太子少傅箴》中指出:「近朱者赤,近墨者黑」,因此有效学习需要学与思并重,可是现时的「深度学习」却未能做到。在现实应用中工程师一旦发现人工智能系统失效,他才会重新进行学习,把系统效能更新,但新旧系统交替需时,往往数以月计,效果大受影响,不设实际。
俗语说:「熟读唐诗三百首,不会作诗也会吟。」不论采用什么算法,「机器学习」背后的操作模型主要是基于这概念。例如,人工智能可以学习巴赫的音乐,然后用它的风格来编新曲,而一般人都难以分辨出巴赫的真伪。概括而言,要模仿一些重复性较高的应用「机器学习」绰绰有余,不过如此这般的「机器化」学习(learning mechanically)却无法表达人类的情感和创意,但这正是人类「智能」的重要特质。
最后,《论语.学而》曰:「学而时习之,不亦悦乎。」仿效人类,人工智能系统一经开发后要尽快付诸应用,并以满足用户需求为首要任务。但「学无止境」,所以人工智能系统亦应持续学习,就此上述「机器学习」、「深度学习」所面对的学习问题非常迫切,必须尽早解决,不然的话全球人工智能发展便难免会受阻。
(文章观点仅代表作者本人)
作者为香港中文大学工程学院副院长(外务)、香港资讯科技联会荣誉会长
来源:信报