科技日新月异,我们或多或少都在新闻、报章杂志中看过外貌激似真人的人型机器人。
例如,日本石黑浩(Hiroshi Ishiguro)教授建造与自己如同双胞胎的机器人、第一个获得公民权的 *** 机器人苏菲亚(Sophia) ,以及日本长崎奇怪饭店(Henn na Hotel)的人型机器人房务。
现今科技之进步确实让人瞠目结舌,有一些机器人甚至拥有柔软的矽胶皮肤呢!
但也许很多人跟我一样,在看到这些人型机器人时有种诡异、不寒而栗的感觉,尤其是那些越接近真人的机器人,越令人毛骨悚然!
事实上,这样的不舒服感受有个专有名词可以解释,叫做 「恐怖谷理论」 (亦称诡异谷,Uncanny Valley)。
「恐怖谷」最早由日本机器人学教授 Masahiro Mori 于 1970 年提出1。该理论以一曲线(下图)说明,人们面对越像自己(人类)的对象,好感度会越高。
但是当对方的样貌是几乎和自己(人类)一样,却又出现几个 意外的「非人」特征 时(像是,关节处显露的机械构造),好感度就会骤降,掉到曲线图中的谷底。
只有当对象是跟我们完全一样、是活生生的人类时,好感度才会攀升至最高点。
我们看着机器人几乎和真人无异的外貌,以及难免显露的非人特征,像是机器人僵硬的表情、显露的机械构造,或是空洞的眼神,内在观感极为容易被带入恐怖谷中,抗拒感油然而生。
此外,对于静态、动态的对象,此理论也做出不同假定:动态的对象会比静态的带来更强烈的恐惧感。
显而易见地,会动的僵尸比静止的尸体恐怖好几百倍啊!
自 1970 年以来,学者也试着对恐怖谷提出不同解释。
首先,Mori 本人认为这样「恐怖」的感觉来自于一种生存的本能,因为这些似人非人的讯息通常透露着生存上的「危险」,像是看见尸体、残缺的人体躯干等等,大脑会反射性地产生恐怖的感受、让自身避开此情境。
Bartneck 与同事3则是用「框架理论」(Framing theory)来解释此曲线,他们认为这样令人反感的情绪来自于与自身「基模」(schema)相冲突的 *** 物。
也就是说,当我们第一眼看到一个极似真人的人型机器人,脑中关于「人类」的基模会被促发,此基模包含我们对于人类此概念的丰富的知识,因此一旦察觉到任何「非人」的讯息,都会造成认知上的强烈冲突、预期落空,进而产生反感。
此解释更近一步得到功能性磁振造影(functional Magic Resonance Imaging,fMRI)的证据4,以及贝氏数学模型(Bayesian model)的结果5支持。
然而时至今日,研究人员对于恐怖谷产生的真正原因、甚至恐怖谷是否存在,都尚未达成共识。
事实上,Mori当初是根据自身研究经验、个人观点提出这个恐怖谷「假说」,并非根据实证资料推论出的结果。
因此,有些研究者在亲自进行实验、数据分析后,竟得到完全不一样的曲线!
例如,Bartneck与其团队3为了验证恐怖谷理论的正确性,采用一系列不同对象的照片,包含:
他们让 58 位受试者分别观看这些图片,并回答「它有多像人」、「我对它的喜好程度」等等的问题。
研究团队原先预期,受试者应该最不喜欢绿皮肤真人、拟人机器人的照片,因为这两种照片跟真人照片几乎没有差别,仅有少数非人的特征。
殊不知,统计数据的结果显示,虽然动物型机器人的拟人程度最低,却是最受喜爱的对象;人形机器人虽拟人程度位居倒数第二位,受喜爱程度仅次于动物机器人。
完整的喜好排名为:动物型机器人、人形机器人、电绘人像、绿皮肤真人、拟人机器人, 最后才是真人 。
在这个排名中,最令他们惊讶的是,人们对绿皮肤真人与拟人机器人的好感度,不但没有比较低,甚至还高于真人模特儿的照片!而且对人形机器人的照片的喜好同样也高于真人照片。
这样的数据,与Mori的理论大相径庭。
基于这样的数据结果,他们推测真实的曲线可能并非恐怖谷,而是 恐怖悬崖(Uncanny cliff) ,并且建议机器人设计者不应一味追求高度拟人化外观,而应注重外型与功能间的平衡。
然而 Bartneck 研究中令人较为存疑的是,受试者评定真人照片的拟人化程度竟比其他照片都还要低!究竟 58 人的评分是否具代表性? Bartneck 团队从 ELLE 时尚杂志选用的真人照片是否偏误?都有待商讨厘清。
此外,也因为人类拥有丰富的社交经历,对「真人」的喜好较明确,也受个人经历、文化等因素影响。因此,单一、特定的人类照片或许无法代表概括性的「人类」此一种类。
比起「恐怖」的情绪,也有研究团队提出了几乎相反的结果。
Cheetham、Suter,和 Jancke6发现,当我们无法用肉眼判断这张图到底是真人,还是电绘人像(avatar)时,这些越似人非人的脸,越与人们的正向情绪连结,因此,该研究团队认为恐怖谷实际上应该是 「快乐谷」(Happy valley) 。
最后,虽然有研究利用「静态图片」验证了恐怖谷的曲线,但是当 *** 物改成「动态短片」呈现时,曲线反而趋于平坦,与 Mori 原先假定的「动态物体将带来更为极端的恐怖谷现象」完全相反2。
然而我们在解释单一研究结果时,仍不能忘了:不同实验素材(例如,研究者选用的图片、影片)、不同受测对象(例如,受试者是大学生?西方人?)都会对结果产生影响。
另外不可忽略的是, Mori 教授在 1970 提出恐怖谷理论时是以日文撰写,他当时用「亲合感」 (shinwa-kan)来描述本文中的「好感度」,英文里较适切的翻译为「affinity」或是「likability」。
但有许多研究中都选用「familiarity」,而 familiarity 一字强调的是过去经验,而非情感连结,使测量的效度受到质疑1,3。
虽然要统一总结个别研究的结果并不容易,但研究者目前仍普遍认同:要打造能自然与人社交的机器人,一味追求外观的拟人化并非一个明智的解法,反而更需着重在外观与功能上的平衡1,3,7。
因为似人的外貌,会让使用者期待能以似人的社交方式与之互动,然而要模拟人类社交互动是一项极具挑战性的工作,例如,机器人的细微表情、情感表达、语言理解、表达、认知历程、身体律动等等都须加以控制、设计。
从我们目前有的人型机器人来看,此项挑战似乎尚未成功过,即使是那些乍看下与真人无异的机器人,一但开口、与人互动,不自然与漏洞百出的应对便显而易见。
在人机互动中,我们能探讨的面向仍相当多,像是机器人的语言能力、情绪表达、行为模式、互动者人格特质、个人经历,绝非是「外观拟人化程度」一项因素能决定整体互动品质的8,9。
此外,我们对机器人的态度、好感度也受到媒体文化制约著,许多人不喜欢机器人可能是因为电影经常把机器人塑造成「 人类物种的威胁 」。
曾在访谈中开玩笑要毁灭人类的苏菲亚,被全球媒体热烈的报导。
然而,运用科技本身无善恶之分,好与坏终究在于使用者。
更何况,我们目前现有的机器人跟科幻电影中的、一般人期待的都差距非常、非常多。
像是在日本长崎的奇怪饭店(Henn na Hotel),虽在四年前目标成为世界上第一家由机器人组成的饭店,却在2019年因为大多数机器人无法妥善回应房客期待、错误百出,而决定逐渐转回聘用人类员工。
即使现有的社交机器人大多只能做为辅助工具,无法全取代人力,但是研发机器人对人们生活品质的益处,仍是显而易见的。
例如,在人口老化社会中,机器人能补足长照资源不足的问题,取代大部分劳力工作,减轻照顾者的负担10。
回到本文所探讨的问题中心,人型机器人是否会无一避免地掉入恐怖谷中?就目前的研究证据来看,我们似乎尚未能给出一个肯定的答案。如同大多研究问题,正反方的证据同时存在于文献中。
再者,恐怖谷曲线很可能会因个人偏好、生活经历而有所不同。
如 Mori 将「日本人形木偶」(bunraku puppet)放在相当靠近真人亲合度的位置。虽然在 Mori 的理论原文中,他也承认这样的木偶其实说不上是高度拟人化的,但是当在看木偶戏时,会不自觉忘却木偶非人的外观特征,深深融入故事情境与人物情感中。
相对地,我们每个人会觉得亲近、惧怕的对象、特征,也与我们人生经历紧紧连结,这为探讨拟人化外表与互动者好感度关联的议题上,增添了许多变项与困难。
然而,不管恐怖谷存在与否,都提醒了机器人设计者,不该一味追求高度拟人但可能造成反效果的外貌。
皮克斯动画「瓦力」(WALL-E)里的瓦力跟伊芙、迪士尼「大英雄天团」(Big Hero 6)里的杯面,它们长得都完全不像人类,却仍深得观众的喜爱。
要打造良好人机关系、提高大众对机器人的接受度,或许该更强调于情绪表达9、互动模式11、社交技能7,以及使用者在长期人机互动中的心理历程12,13,毕竟,人类在社交互动中也不是单看外表的肤浅生物吧!
humanoid 和 android 虽然时常混用,用来指称似人的机器人,但事实上两词定义有些微不同。
Te-Yi Hsieh|现为英国University of Glasgow 博士生,主修 Neuroscience and Psychology。研究领域介于心理学、机器人学、神经科学的交界处。
欲知更多作者的研究相关资讯可关注: //so-bots/ Twitter: @TeYiHsieh