人形机器人Ameca展示了视觉感知能力与声音克隆能力：学会“睁眼看懂世界”，还来了段名人模仿秀。表情是Ameca的一大特点，她会在回答时直视对方，会歪头端详，会垂眼思考，还会微笑。

作者 | 郑远方

世界上最像人的人形机器人，又进化了。

“Ameca，最近怎么样？”“嗯……就勉强活着吧。”——英国机器人公司Engineered Arts最新视频中，“当家花旦”人形机器人Ameca以这样一个回答开场后，展示了一番视觉感知能力与声音克隆能力。

机器人“睁眼看世界”不是什么新鲜事，而Ameca这次掌握的，是“睁眼看懂世界”能力，即基于视觉的分辨能力。

当研究人员要求Ameca描述所处的房间时，她会在左顾右盼一番后开始发言，中间还夹杂些许“英式嘲讽”：房间的窗户开着，光线太亮、让人睁不开眼；书架上摆着很多书，不知道是真求知还是假学问；还有桌椅，那是生产力工具，也是拖延症帮手……

被问起研究人员手中拿着什么时，Ameca不仅可以精准识别出机器人玩具、医学人头模型，还会加上细节描述，例如“是过去时代的东西”、“有怀旧气息”、“做得很细致”等。

除了视觉能力，Ameca还学会了声音模仿。

在视频的后半部分，Ameca模仿起了摩根•弗里曼、马斯克、海绵宝宝的声音，在每段模仿秀中，还保留了他们各自的说话风格；最后，还按照研究人员要求，来了一段“海绵宝宝声音、特朗普说话风格”的演讲。

在问答全程中，Ameca的眼珠会跟随研究人员的行动而移动，会在回答时直视研究人员，也会歪头端详，会垂眼思考，还会微笑。

这便是Ameca最突出的特点——表情。之前Ameca就曾因为表情逼真、“过于像人”而走红，甚至一度被称为“最像人”、“最先进”的人形机器人。

这次的视频中，只有半身无手版Ameca出场；而在此前的视频中，全身版Ameca还会在对话过程中，配合不同表情作出不同的手势。

不仅如此，Ameca还接入了GPT-3/4、Stable Diffusion，熟练掌握语言对话能力、绘画能力。

图|Ameca作画过程图|Ameca作品

值得一提的是，在2024年世界移动通信大会（MWC）上，Engineered Arts还推出了第二代Ameca机器人，由GPT-4提供支持。

虽然在表情展示方面，Ameca作为人形机器人已遥遥领先，但目前它还不能行走。Engineering Arts计划未来将其改造升级，让其具备行走、奔跑等更多能力。

切换到网页版

“最像人的机器人”又进化了

科创板日报 2024-02-28 09:07:39