人工智能系统建基于「大模型」训练,背后大数据的质量至关重要。乌克兰人工智能武器在训练中采用了大量「合成数据」(Synthetic Data)。「合成数据」是一种模仿真实世界数据,利用「生成式人工智能」(GenAI)技术而生成的。生产商使用「合成数据」进行研究、测试、新开发和机器学习。然而,要注意的是,尽管先进技术让「合成数据」的生成变得高效且快速,但「垃圾入垃圾出」(Garbage In Garbage Out),因此「合成数据」的质量对生成系统至为关键。不过,乌克兰所生产的人工智能武器所采用的「合成数据」质素成疑,更有些是基于模拟器所产出的资讯;这些数据测试不足,严重影响武器的可靠性。
「前车可鉴」,且看下述「巴以冲突」中以军误炸,便是人工智能武器失灵的好案例。据独立线上新闻媒体「+972杂志」报道,以色列在加沙攻击中多次采用一套命名为「薰衣草」(Lavender)的人工智能系统来辨识加沙地区内的袭击目标。然而,「薰衣草」的准确率只得90%,即是说它在辨别袭击目标时有10%误判的机会。这导致近期「世界中央厨房」(World Central Kitchen,WCK)人道主义援助车队被误炸,三部车辆上的WCK标志非常之明显,而且车与车之间亦保持了一定的距离,在这些条件之下,以军的人工智能系统仍然会出错,「误中副车」,效果实在不可思议,令人不寒而栗!
人工智能系统建基于「大模型」训练,背后大数据的质量至关重要。乌克兰人工智能武器在训练中采用了大量「合成数据」(Synthetic Data)。「合成数据」是一种模仿真实世界数据,利用「生成式人工智能」(GenAI)技术而生成的。生产商使用「合成数据」进行研究、测试、新开发和机器学习。然而,要注意的是,尽管先进技术让「合成数据」的生成变得高效且快速,但「垃圾入垃圾出」(Garbage In Garbage Out),因此「合成数据」的质量对生成系统至为关键。不过,乌克兰所生产的人工智能武器所采用的「合成数据」质素成疑,更有些是基于模拟器所产出的资讯;这些数据测试不足,严重影响武器的可靠性。
「前车可鉴」,且看下述「巴以冲突」中以军误炸,便是人工智能武器失灵的好案例。据独立线上新闻媒体「+972杂志」报道,以色列在加沙攻击中多次采用一套命名为「薰衣草」(Lavender)的人工智能系统来辨识加沙地区内的袭击目标。然而,「薰衣草」的准确率只得90%,即是说它在辨别袭击目标时有10%误判的机会。这导致近期「世界中央厨房」(World Central Kitchen,WCK)人道主义援助车队被误炸,三部车辆上的WCK标志非常之明显,而且车与车之间亦保持了一定的距离,在这些条件之下,以军的人工智能系统仍然会出错,「误中副车」,效果实在不可思议,令人不寒而栗!