文|陈亨达
数码世界依靠数据驱动,其运作的三大支柱是数据、算力和算法。上月讨论的大数据(Big Data)及云计算(Cloud Computing)正是前两者,至于代表算法的产业便是人工智能(Artificial Intelligence),三者形成数码世界的ABC三大基础设备,三个要素缺一不可,相互促进、相互支撑。以美食作为比喻,大数据相当于食材;云计算是烹煮需要的煤气或电力;人工智能的演算法便是烹饪方法,必须三者俱备才能炮制出美味佳肴。
人工智能的概念早在70年前已有科学家提出。1956年夏天在美国达特矛斯(Dartmouth)举行了一个关于人工智能研讨会,正式提出人工智能(AI)的定义。随着电脑出现,当时的科学家便构想将人类智能赋予电脑,让电脑模仿人类思考,进而模拟人类的能力或行为。AI作为一门学科便在这时起步,人们普遍将这一年称为AI元年。
时至今天,AI已进入了人类的生活。我们日常接触到的智能手机、叫车软件、社交媒体、导航、搜寻引擎等都运用了AI技术。不过,这种在特定范围执行具体任务的AI只属于“狭义人工智能”(Narrow AI)。至于能够模仿人类思维、决策,有自我意识、自主行为的“通用人工智能”(General AI)现时仍只能在科幻小说或电影找到,未能成为现实。
在AI发展初期,利用以法则为主(Rule Based)的程式,将人类专家的知识和经验变成数据形式,通过数据让电脑进行推理,这种系统拥有多条法则,可进行简单的推理,称为专家系统。这些法则要明确,数量要少,例外的情况不能多,所以适用处理结构化的数据,但面对大范围、数量多、非结构化的数据便难以应付。
机器学习数据为本着重学习
除了法则为本的程式外,AI另一重要分支是机器学习(Machine Learning)。与法则为本的方向相反,机器学习从下至上,着重AI模型的学习,尽可能提供大量数据,经由人类知识从数据提取一些具有特征的数据(feature data),譲AI模型学习,然后用学习好的模型去判断数据并得出问题的答案。
机器学习将复杂的智能问题换成相对简单的统计问题,而电脑正是处理统计数据的能手。经过大量数据的训练后,AI便能总结出规律,应用到新的样本。如果在缺乏足够数据的全新场景,AI只能瞎猜,无用武之地。现时学术界普遍相信,让电脑获得智能的关键是大数据,因此机器学习已成为AI的主流方式。
虽然“喂饲”AI越多数据便越有智慧,但只要仍需人类参与特征工程(把原始数据转变成特征的过程),效率便难以提升。科学家便模仿人类的生物神经网络(Biological Neural Network)的结构和功能,创造出一种人工神经网络(Artificial Neural Network)数学模型。
人工神经网络由大量人工神经元(与人脑运作相似)联结进行计算,是一种自适应系统(adaptive system),可根据环境变化调整自身,使行为在新环境下仍能达到最佳功能。简单来说,这便是具备了学习功能,因此,深度学习(Deep Learning)在提取特征的过程已无需人类协助,可以自行从海量数据中通过持续学习而完成。深度学习现时是机器学习众多分支中,最广为应用的AI技术。
AI决策系统赢围棋世界冠军
机器学习或深度学习较普遍的应用范畴有5类。一是电脑视觉(Computer Vision),如用于手机解锁、安全监控、门禁系统等的人脸辨识技术。二是自动语音辨识(Automatic Speech Recognition)技术,手机的语音输入法或智能语音助手如Siri、Echo等均属这类,可从语音中说一段话,随即翻译成另一种文字,实现不同语言之间的交流。
三是自然语言处理(Natural Language Processing, NLP)。它是在机器语言和人类语言之间沟通的桥梁,实现人机交流。NLP最常见的例子是电邮筛选器,最开始是垃圾邮件筛选器。Gmail电邮系统更进一步可根据内容识别出电邮属于主要、社交或促销三类中的哪一类。此外,也常用于智能助手、语言翻译、搜寻引擎等。
四是决策系统。最著名例子是1997年IBM的超级电脑Deep Blue(深蓝)打败国际象棋世界冠军,另一例是2016年打败世界围棋冠军的AlphaGo。现时决策系统已在自动化、量化投资、AI游戏等范畴广泛应用。最后一类是大数据应用。社交媒体通过你看过的文字或图像,知道你喜欢的内容,便可进行更精准的营销。
AI在电脑视觉及语音技术的应用已有蓬勃的发展,未来重点是增加不同场景的应用。在NLP的范畴仍需在语意理解能力方面努力。至于决策,则要在通用能力再下功夫,令电脑学习到的知识可以在不同场景运用。
关注伦理推动可解释AI冒起
现时Al技术及产业应用已成为人类生活的“必选项”,但AI究竟是甚么?对我们的生活带来甚么改变?不少人仍然一头雾水,尤其是深度学习的能力,在某些范畴已超越人类,但透明度却不足,令人难以理解。
近年业界关注AI的伦理及治理问题,可解释AI(Explainable AI)成为业界研究的新兴范畴,核心议题是AI的透明度与可解释性。欧洲、美国及中国等主要国家近年均立法监管AI的运用及带来的私隐问题。联合国教科文组织(UNESCO)更在2021年通过首份AI伦理协议,提出包括“透明性与可解释性”在内的10大原则。
部份人对AI仍停留在电影未来战士(Terminator)的恐怖形象。当然拥有自我意识的通用AI可能会在未来出现,但我们必须认清AI对人类有甚么影响,如何发展才对人类是最合适的。究竟AI最终会成为人类最佳的助手,抑或最恐怖的敌人?我们要主动掌握在自己的手中。
(作者系香港中国商会常务副会长)