摘要
双子机器人,是一种可以通过互联网等媒介实现远程操作的Android 机器人,其外表与操作者本人一模一样。双子机器人的原文Geminoid 是Gemini(双子座)和oid(类似)所组成的新造词,这是一种全新类型的仿人机器人。
关键词
Android 人类与机器人的关系 远程操作机器人
1 Android 机器人开发的问题
Android 机器人不仅拥有酷似人类的外表和细致动作,也有某种程度的知觉功能。但是其对话能力非常有限,与人类交流的时间也相应地受到限制,主要原因在于声音辨识上的困难。如果没有一定的声音辨识能力来匹配人类的外表和动作,就显得不自然。比如2005 年日本爱知世博会上展示的女性Android 机器人ReplieeQ2,ReplieeQ2 以真实女性为模板开发,在严格限定情境或内容的情况下,ReplieeQ2能够像人一样地对话,但是限于目前的声音识别技术,仍无法达到与人自由应答的程度。
要克服声音识别的问题,难度非常大。即使声音识别技术本身已经改善到了某种程度,但机器人要达到人类的对话水平,仍必须从声音信号中读取感情等众多信息,然后再选择恰当的语言与动作。要解决这个问题,需要更高级的人工智能技术,而以目前的技术水平而言,尚无法获得彻底的解决方案。
于是,双子机器人在Android 机器人的基础上加装了通过远程操作可进行对话(远程对话)的功能。尽管除了Android 机器人外,在家庭内及公共设施中提供服务的仿人机器人也正在开发当中,但这种远程对话的功能,对这类仿人机器人来说都是必须的。不过,仿人机器人的对话能力本来也不必达到人类的水平,而且要开发出能够回答人类所有问题的机器人着实困难,因此远程对话成为目前这类机器人的必备功能。
2 双子机器人的开发
目前双子机器人的操作方式为远程操作,操作者同时观看两个屏幕,然后用按钮选择双子机器人的大致动作。两个屏幕中会分别显示双子机器人和访问者。另外,操作者眼前的计算机屏幕上,则有往右、往左、点头等动作按钮供选择,操作者可一边对话一边适当地按下按钮。操作者所选择的动作会与以往装载在Android机器人中的少许下意识动作1)匹配,再通过双子机器人的身体表现出来。
远程操作中最重要的是保持双子机器人的嘴唇动作与操作者的声音完全同步。为此,必须在操作者的嘴唇周围配置标记,以动作捕捉系统正确地测量其动作,然后传送给双子机器人。嘴唇动作与声音的重要性,不但能够为与双子机器人面对面的访问者带来双子机器人正在说话的感觉,而且对进行远程操作的操作者本身来说也很重要。操作者虽然是通过屏幕观察双子机器人的身体动作,但是看到自己发出的声音与双子机器人的动作产生同步,还有头部动作与自己的动作同步,也会产生一种那就是自己身体的错觉。
另一方面,此系统的难点在于时间差。双子机器人与访问者所在的房间内设置了麦克风,操作者会监听房间内的声音。此时,操作者的声音是通过网络传送的,因此听起来会有时间延迟。由于人类习惯一边听自己几乎没有延迟的声音一边说话,所以只要自己的声音反馈得稍微慢一些,就会变得无法正常说话。为了解决这个问题,需要将传送至网络之前的声音,与从双子机器人和访问者所在的房间送出的声音进行合成,然后再让操作者听见。合成之后,虽然会同时听到几乎没有延迟的声音和有0.5s~1s 左右时延迟的声音,不过至少消除了对话中的障碍。
3 对话的适应
双子机器人有一种过去Android 机器人所没有的强烈临场感。双子机器人坐着不说话的时候,给人的印象与Android 机器人并无不同。但是,开始远程对话后,访问者和操作者都感受到了非常强烈的临场感。访问者在最初还会对双子机器人周围的摄影机及各种装置感兴趣,但在对话5分钟后,就会自然而然地望着双子机器人的双眼说话。不过另一方面,操作者虽是一边看着屏幕一边说话,然而却感到非常拘束。双子机器人本身构造复杂,能够表现的动作又相当有限,对话开始一阵子之后,操作者就感觉到自己开始下意识地做出动作去配合双子机器人那些有限的动作。这些现象,并未通过精密实验确证,而是基于笔者及其他数人的经验所发现的。现在,研究者正以精密的实验对这些现象进行确认及研究。
比临场感更让人兴趣盎然的现象,是对话一阵子之后,如果访问者戳双子机器人的脸颊,操作者竟也有脸颊被戳到的感觉。和Android 机器人一样,双子机器人的皮肤上装了许多触觉传感器。但是这些感应信息并不会传送给操作者,操作者只是看着屏幕进行对话而已,却能产生与机器人相同的感受。此现象目前也正以脑科学的方法进行验证,针对其原因有以下推测:人类的脑中有辨识人类的模式,该模式的一部分一旦对酷似人类的外表、动作及对话进行匹配,人类就会下意识地做出这是人类的预测,将机器人与人类相关联。正是这种预测使实际上并未被碰触的皮肤产生触碰感。双子机器人可以用于出席会议。实际的会议情况如图2 所示。该会议也和刚才的一对一会话一样,会议参加者在刚开始的前几分钟,都在注意双子机器人以外的东西,或是忽略双子机器人的对话。然而5分钟后,参加者就习惯了此种形式,可以与双子机器人对视并自然地进行会谈。在此过程中,学生们的反应特别有趣,当笔者通过双子机器人说话时,他们就好像真的置身于某场会议之中,不敢去碰触双子机器人的身体。由此可推知,双子机器人给人带来的感觉对学生来说,是相当接近真人的。双子机器人在这场面谈中表现出的存在感,以及类似人类的权威表现,都必须经过更长期且更精密的实验来进行分析确证。
4 利用双子机器人进行认知科学的研究2)、3)
在制作女性Android 机器人时,涉及技术及科学方面的问题是制造出“人味儿”1)。人类是从人的何处感受到人味儿,又要如何让Android 机器人表现出人味儿,这在过去一直是一个大问题。不过,Android 机器人能够与人类自然交流的时间较短,而且即便交流时间长,为了要维持机器人的“人味儿”,交流的方式也会十分有限。另一方面,双子机器人能够交流的时间较长,需要解决的问题也从单纯的有人味儿,发展成“类人存在”等感觉。关于类人存在有以下(1)~(3)几个问题。
(1)认知自我与认知他人
“开发双子机器人的那一年,一开始不会动的双子机器人,对我而言就好像镜子中的影像。因为可以从不同于以往的角度看见自己,所以在这一点上多少有种奇妙的感觉,不过我并不会产生机器人就是我自己的想法。当研究团队的成员实现机器人的动作时,我也不觉得那是我自己的动作。但实际上,那些动作都是研究人员用摄影机将我的动作拍下来,然后谨慎地让双子机器人重现出来的,可以说确实是我的动作,研究团队的其他成员也都一致认为和我一模一样。”
这个经历告诉我们,其实“我们自身”并非如自己所想,人类并不能正确地认识自己。可是,假如完全不认识自己,恐怕就无法在社会上生活。将自我认知的程度维持在适当限度之内是很重要的。至于要想知道何谓适当的限度,就必须得弄清楚人类自身所拥有的社会性相关功能以及转变成自我认知的功能的重要参数。之后,这个问题又发展为“自己是什么”的疑问上。
(2)存在感与权威
通过与双子机器人的对话,访问者们感觉到了笔者的存在,同时学生们甚至还感觉到了权威气息。这一点与双子机器人人类式的外表、动作、对话有极大关联,而这些因素要在何种程度、何种组合下才能保持最好的效果,不仅是Android 机器人或双子机器人等开发特殊机器人时面临的重要问题,也是与人相关的各种媒体面对的共同基本问题。
人类有将谈话对象拟人化的倾向,且人脑的多数功能,都是用来辨识人类的。为了弄清人脑的这种功能,探求感知人类存在感的最低条件十分重要。
(3)对Android 机器人的适应
操作者和访问者双方都经由对话被带入双子机器人的系统中,而且适应情况良好。一旦习惯通过双子机器人对话,在某种程度上就会感觉这种形式十分自然。当然,尽管与直接交谈相比仍然大不相同,但是只要进一步改善技术,这种不协调感就会更加趋缓,对话也会更加自然。就这层意义而言,目前的双子机器人已经可以表现出人类的存在感了。
尤其是访问者触摸双子机器人的脸颊时,操作者仿佛也感觉到脸颊被碰触。可以认为,操作者将双子机器人的身体视为了自己的身体。也就是说,操作者通过网络产生了错觉,把远处双子机器人的身体当成了自己的身体。这种情况,可算是大脑与身体通过网络相连的一种状态。
这也引出了下一步的基本问题,即人脑与身体间信息的交流与分离机制。以双子机器人目前的系统来说,操作者必须同时观看两个屏幕,如果只用一个屏幕是否可行?双子机器人能实现何种程度的自动应答?这些有趣的问题,都将随着双子机器人技术的发展,继续思考研究下去。
如上所述,Android 机器人的“人味儿”是偏向心理学、认知科学研究的部分,而双子机器人使这部分研究发展成了“人类的存在”这种在某种意义上是近乎哲学性的问题,它也是首个让人类思考此类哲学问题的机器人。
参考文献
