DeepSeek新突破 让AI拥“遗忘智慧”-紫荆网

DeepSeek新突破 让AI拥“遗忘智慧”

日期:2025-11-11 来源:《香港经济日报》 浏览量: 字号:
分享到
用微信扫描二维码

| 黄岳永

DeepSeek近期发表的DeepSeek-OCR,乍听是光学文字辨识系统,实际却别开生面。它并非逐字处理,而是将整页文字化为影像,令模型以较少“token”记住更多内容。

研发团队的灵感,来自人类的记忆与遗忘机制--随时间流逝,画面被再次压缩,解析度下降,却换来更高效率。

遗忘非缺陷 而是内在秩序

技术的核心卖点不难理解,用token更少的“视觉词元”取代逐字纪录,并能够输出可编辑的文字或结构化的内容。想像一下,一整页A4文件,每个字转换为数位文字,可能包含1,000个文字token。但如果将这页文件“拍一张照”,让AI储存这张图,它可能仅需100个“视觉词元”就能捕捉所有资讯,即是可以将其压缩10倍;而后要翻查资料进行解码,模型能达到97%的惊人解码(OCR)精度。即便在20倍的极限压缩下,精度仍保持约60%。

这种“模糊化”做法,就如人心的缩影。人类的记忆功能并不像传统电脑一样,会记录每个细节。我大脑会将印象、关键资讯和情感连结,而非毫厘不差的细节,简而言之就是会将记忆重新编码,以便更有效地储存它们。DeepSeek-OCR正好提醒我们:遗忘并非缺陷,而是一种内在秩序。

在数码时代,云端备份与无限储存已成常态,“不遗忘”被视为进步的象征。

其实,人生的智慧恰在于懂得放下。记得我爱猫离世那段时光,初时回想便如重温悲剧,内心完全是痛苦悲伤,又会自怨自艾。随着年月推移,记忆虽然变得模糊,但内心苦痛悲伤也化为温柔的怀念。心理学称这个现象为“适应性遗忘”:让伤口结痂,使生命得以延续。

远期记忆 随时间自动淡化

《Inside Out》(玩转脑朋友)是笔者一套印象甚深的电影,原来“第一集”上映已经是10年前。还记得其中一个角色Bing Bong,出现不多却意义深远,它是主Riley童年时的幻想朋友,随着Riley长大,他逐渐被遗忘,故事最后他牺牲自己,即使化为虚无也希望Riley能够快乐。Riley遗忘了童年玩伴Bing Bong,而正正是那份失落,成就了她成长的契机。被遗忘的,并非消失,而是融入内心,化为前行的力量。

回到DeepSeek-OCR,其寓意远超技术层面:以人的角度,重新思考资讯的价值。它试图将一维语言转化为二维视觉,为人工智慧开拓另一种记忆形态:让“近期”资讯保持高解析,而“远期”记忆随时间自动淡化。此举或为“无限上下文”架构提供答案--在资料保留与运算成本之间,取得生物般的动态平衡。

未来AI 料不再需昂贵硬碟

可以想像一下,未来的AI不再需要一座昂贵无比的硬碟,而有层次、有节奏、有呼吸的记忆系统。它懂得保留重要、淡忘冗余--如同人类在岁月的淘洗中,学懂甚么该记得,甚么该放下。

其实对人类而言,我们需要的从来不是巨细无遗的记忆,而是真实的记录。要记得爱和信念,而非痛苦和遗憾;记得选择方向时的经验,而非路上的一个个坑洞陷阱。无论是机器抑或人心,都需要“选择性遗忘”才能重生。那不是抹去记忆或拒绝回想,而是重整和再造。从记忆的迷雾中,我们选择留下的不是创伤,而是可以面向未来的智慧。

【知识库】DeepSeek-OCR有何特点?

•引入光学2D映射机制,将长篇扫描文件的视觉与文字资讯压缩至原始大小的十分之一,同时完整保留版面格式。

•大幅降低AI处理时的token消耗。

•具备“光学理解”能力,能分析文件布局、支援手写笔记、多语言混排等。

•模型仅6.6GB,可在本地GPU运行,解决了AI扩展的“成本爆炸”难题。

•具备“随时间动态压缩”的机制,能持续节省记忆体与储存空间。

(作者系香港科技大学副教授兼高级顾问<创业>,文章仅代表作者个人观点)

来源:《香港经济日报》

扫描二维码分享到手机

编辑:蓝皓源 校对:杨晨 监制:张晶晶
国台办:和平统一后 台湾同胞再也无需为各种能源物资短缺而焦虑
康文署辖下44个泳馆今日起开放
习近平:树立和践行正确政绩观
王毅同巴基斯坦副总理兼外长达尔会谈
紫荆杂志
影响有影响力的人