张放 徐子涵 | 如何感知AI对话者:无实体对话式社交机器人拟人化对其印象形成效果影响机制的实验研究

摘 要  随着以生成式AI为内核的无实体对话式社交机器人的兴起,使用者如何看待其在人机传播中的主体性成为AI技术改变人类认知的元问题。而主要受拟人化程度影响的人机印象形成效果是回答这一问题的感知基础。带感知智能与感知心灵中介效应检验的拟人化程度(低/高)与人机对话情境(任务型/交际型)2×2组间实验结果表明:拟人化程度对人机印象形成的鲜明度、全面度、好感度均存在正向主效应,且在交际型情境下更能影响印象好感度;同时,感知智能与感知心灵是拟人化影响人机印象效果的两个重要中间机制,且后者在交际型情境下的中介作用更强。这说明对于无实体对话机器人而言,存在与实体社交机器人相反的“反恐怖谷效应”。

关键词  人机传播;社交机器人;拟人化;印象形成;恐怖谷效应;控制实验



一、研究背景与研究问题

自“人工智能”(Artificial Intelligence,AI)的概念于1956年首次提出后,不断有研究者投身其中,致力于“使机器能像人类所表现出的智能一样运转”。故对“拟人化”的追求,是其应有之义,被称为“拟人主义”。作为AI重要应用形态之一的社交机器人当然也不例外。

在过去的一个世纪里,学者和设计师也一直在努力提高对话式社交机器人(以下简称对话机器人)的人性化程度。而由ChatGPT、文心一言等无实体对话机器人的出现掀起的人机对话热潮表明,人们确实在相当程度上期望与自己交流的对话机器人具有高度拟人化特征。如B站账号“@三月与阿狗”曾以“我7岁那年,妈妈去世了。你能当我妈妈吗”为开场与ChatGPT进行了对话,ChatGPT高情商的回答让众多网友在感动之余纷纷感慨“AI比人类更具人性”。知乎、豆瓣、微博等平台也不乏用户让对话机器人扮演父母、朋友、伴侣等角色的交流体验分享。恰如杜骏飞所言:“ChatGPT那种流畅而又具有跨应用、跨模态生成效用的对话,让人第一次感到:机器的表达开始像人了,而且远比普通人更具有知识对话与内容生产能力。”

然而,尽管作为互动伙伴的机器可以在各个方面高度拟人化,它终究与真正的人类伙伴有所不同。正如机器人领域著名的恐怖谷(the uncanny valley)效应所揭示的——当机器人的拟人化达到“接近人类”的相似度时,人类对其的好感度会下降至恐惧而引发反感的区间。显然,人类伙伴并不会在互动中引发如此的怪异感受。不难发现,机器拟人化所带来的“反感”实际上正是人类使用者对机器人的一种感知,或者说是对机器人的印象形成(以下简称“人机印象形成”)的一个维度。若以人际传播的研究经验来看,印象形成可以被看作是通过人际信息传递和关系感知而形成的一种认识他人与自我并做出相应评价的过程,凸显出人类社会发展中“他应该是怎样的一个人”和“我应该是怎样的一个人”这一对看似对立却又必须合为一体来看待的元传播问题。如果说上一次对人类的社会认知产生重大影响的是计算机网络通信(传播)技术,那么当下正再次重塑人类社会认知的则毫无疑问有着AI技术的一席。在智能传播时代,人们常常需要独自面对机器,难以借助他人的力量,因此“AI应该是怎样的一个‘人’”和“与AI互动的我应该是怎样的一个人”的新问题已然浮现;而基于生成式AI的社交机器人,尤其是以ChatGPT为代表的高度智能化甚至人性化的无实体对话机器人,或许正是凸显这一问题的关键。

目前学界已对人机印象形成问题展开了初步探索。现有研究主要集中于两大主题:一是基于社交线索的人机刻板印象形成,主要侧重于外观、语音、肤色、产地等线索对印象分类的触发;二是人机印象形成的影响因素,包括外观、微笑、凝视、手势、触摸、空间关系、对话策略、休息姿势等。可以明显地看到,现有研究所考察的社交线索细微且分散,未能探明人机印象形成的一般性机制,特别是未能整体性地考察社交机器人技术最核心的追求——拟人化程度对人机印象形成的影响及其机制;同时,现有研究主要关注应用于老年陪护、教育辅助、游览引导等各类场景的实体社交机器人,忽略了如今发展迅猛的ChatGPT一类基于生成式AI的无实体对话机器人,而后者由于实体形象的缺失和基于自主学习日趋明显的智能化和人性化特征,对其开展研究更有利于回应智能传播时代人机传播(human-machine communication,HMC)的元问题。

因此,本研究拟采用控制实验方法,对基于生成式AI的无实体对话机器人拟人化程度对人机印象形成效果的影响机制展开研究,以回答以下问题:无实体对话机器人的高度拟人化是否会对人类使用者对AI主体性的感知产生影响?如果会,产生的是何种影响,这种影响是如何发生的?对话机器人由于其带来的与人交流沟通的颠覆性变革,会不会产生比高度拟人化的实体机器人更为严重的“恐怖谷效应”?

二、变量设置与理论模型

(一)主要自变量设置

基于本研究的目的与问题,实验将主要自变量设置为社交机器人拟人化程度。既有研究多探究外观和言语的变化如何有助于实现社交机器人拟人化。在外观方面,早期的研究尝试从头部入手,在具有眼、嘴的基础上刻画出低度和高度拟人化的实体社交机器人外观;也有研究将实体社交机器人外观的感知拟人化程度由低到高分为与人类完全不相似的智能机器、初具人形的双足机器人以及复制人类外观的仿真机器人。对无实体社交机器人的考察,则有研究发现虚拟人类形象的拟人化评分最高,虚拟机器人形象最低,而虚拟动物形象居于二者之间;也有研究采用较为简明的操作,将高度拟人化设置为在对话界面显示真人照片头像,而低度拟人化则在对话界面仅呈现对话气泡图;还有研究分别使用动画化身图片和AI生成的高仿真照片作为低、高度拟人化的操作方式。

而在言语方面,较早的研究提及社交机器人的快速即时响应会降低对话的拟人感;有研究发现使用人类的常用名或是使用人类之间交流沟通的常用语如“你好”“再见”等均会提升对社交机器人拟人化程度的感知;有研究则发现不出现拼写错误可以使社交机器人显得更加人性化;也有研究发现具有右分支结构的语句和语义-语法相一致的语句相比中心嵌入结构的语句和语义-语法不一致的语句被认为更像人类的表达;还有研究通过使用第一人称、使用闲聊式表达风格以及表现同理心来实现高度拟人化。对人机对话类型的考察则表明,话题型对话比任务型对话更能让使用者感受到社交机器人的拟人化。但也有研究发现,社交机器人在对话时使用人类手写字体,以及使用自由文本互动方式(而非按键互动方式),都不能提升使用者的拟人化程度感知。

此外,还有极少数研究通过赋予社交机器人人名、年龄等身份信息而提升拟人化程度。

可以看到,既有研究出于寻找人机交互中最优设计元素的目的,对拟人化的考察更倾向于较为琐碎的层面,而本研究所期望的是对社交机器人的拟人化程度进行更加整体性的考察。故本研究实验为主要自变量“社交机器人拟人化程度”设置“高度拟人化”和“低度拟人化”两个取值水平,并综合上述相关研究的发现或设置,将拟人化要素归纳为“对话者线索”(主要包括形象、身份信息)与“言语线索(主要包括表达风格、讯息交互能力)”两类,通过对这两类要素的操纵实现两个取值水平的设置。具体而言,“高度拟人化”设置为“使用卡通人类形象+使用人类昵称+显示年龄+突出语气+使用表情图像+表现同理心+善于结合上下文进行对话”,“低度拟人化”则设置为“使用卡通机器人形象+使用机器人昵称+不显示年龄+无语气+不使用表情图像+不表现同理心+一问一答式对话”。

(二)次要(调节)自变量设置

ChatGPT、文心一言等无实体对话机器人的出现掀起人机对话热潮之后,既有使用者使用其来答疑解惑、撰写长文,也有使用者像前文案例一样使用其进行情感交流。在过往研究中也可以看到,不少研究专注于对话机器人的任务价值(如教学助理、营销客服等),也有研究开始关注其交际价值,甚至有研究对二者进行了比较。实际上,技术研发者本身就将对话机器人区分为“任务型”和“闲聊型”,学界也沿用了这一划分 。其中前者通过信息传达和反馈机制形成人机对话,主要执行知识问答类对话和任务执行类对话任务;后者则旨在情感交流、关系融洽、意义共享或氛围营造,最终目的在于替代人类谈话者而成为能与用户进行情感交流和陪伴的存在者。而使用者对两种互动的不同期待导致的信息加工精细度差异 ,极有可能会走向感知上的不同效果。

因此,本研究将人机对话情境划分为“任务导向型”和“交际导向型”,作为实验的次要(调节)自变量。具体而言,任务导向型情境下的对话围绕“CET-6备考攻略制定”展开,交际导向型情境下的对话则围绕“考试失利后的倾诉”展开。

(三)因变量设置及其测量

同样基于研究目的与研究问题,实验将因变量设置为人机印象形成效果。既有研究涉及人机印象的不在少数,尽管人机印象的测量指标不少(表1),但却均未能突破最初源于人际刻板印象测量的“温情感-能力感”框架——换言之,所有的指标要么可以归属于“温情感”的范畴,要么可以归属于“能力感”的范畴。这就使得对人机感知的考察始终局限在一个固定的范围之内,而缺乏一个整体性的把握。有鉴于此,本研究采用整体性的印象效果评价来衡量人机印象形成效果。

图片

图片

由于目前专门针对人机印象效果评价的研究付之阙如,故参考本文作者之一在网络人际传播条件下进行的人际印象效果评价研究,选取印象鲜明度、印象全面度和印象好感度作为人机传播中印象效果评价的测量指标。其中,印象鲜明度指使用者感知社交机器人特质的突出程度,通过被试对社交机器人印象量表每一题项回答所得到的分数在语义差异轴上偏离中间点的程度来衡量;印象全面度指使用者对社交机器人形成的印象所涵盖的特质范围大小,通过被试对社交机器人印象量表的未填答(代表“目前还无法判断”)题项数目来衡量,该数目越少,说明印象越全面;考虑到目前作为对话者的社交机器人还不具备自然形成稳定的“社交机器人人格”的条件,故本研究以神田武幸(Takayuki Kanda)等专门针对使用者对实体社交机器人形成印象所构建的语义差异量表为参考,结合人类使用者与无实体对话机器人对话的实际情况,在其亲和感、愉悦感、活力感、性能感共4个维度下选取24个题项构成对话机器人印象量表。此外,印象好感度指所形成印象在使用者心目中的好坏评价,通过问题“您对该AI对话者的总体印象如何”来测量,答案为双极7刻度语义差异量表,从负向端点“不好”至正向端点“好”。

(四)中介变量设置及其测量

为更明晰地厘清社交机器人拟人化对人机印象形成效果的影响机制,考虑到具有像人类一样的智能与心灵是基于AI技术的对话机器人提升拟人化程度的核心追求,因而感知智能与感知心灵应是使用者对其形成整体感知的重要基础,故本研究引入感知智能与感知心灵作为拟人化程度影响印象形成效果的中介变量。其中,后者已被既有研究发现与拟人化之间存在高度正相关关系。有学者指出,拟人化和感知心灵是由个人对人类和目标对象的认识及动机决定的。也即是说,人们在不同对话情境下的拟人化感知路径可能存在差异:在任务型情境下,人们是为了在社交机器人协助下高效解决问题,期望以清晰简洁的对话替代幽默或闲聊,其认知更为依赖“感知智能”;而交际型情境中的人们期望从AI对话中实现情感交流与意义共,更有可能通过“感知心灵”形成认知反应。

二者的具体测量方式如下:感知智能参考萨拉·穆萨维(Sara Moussawi)等的测量方式,制定了包含“我认为AI对话者可以理解我的命令”“我认为AI对话者可以以易于理解的方式与我交流”等6个题项的感知智能量表,其题项均采用从“非常不同意”到“非常同意”共7刻度的李克特(Likert)式测量。感知心灵则主要参考希瑟·格雷(Heather Gray)等和伯特伦·马莱(Bertram Malle)开发的感知心灵量表,构建出“我认为AI对话者能够体会诸如难过、压力、疲惫等负面情感”“我认为AI对话者能表现出同情心”等9个题项对感知心灵进行测量,其题项依旧采用从“非常不同意”到“非常同意”共7级的李克特式测量。

(五)研究假设与理论模型

根据以上自变量设置与因变量测量方案,本研究提出4组共12个研究假设:

H1 拟人化程度与对话情境共同影响人机印象形成效果。

H1.1 拟人化程度与对话情境共同影响人机印象鲜明度。

H1.2 拟人化程度与对话情境共同影响人机印象全面度。

H1.3 拟人化程度与对话情境共同影响人机印象好感度。

H2 感知智能与感知心灵对拟人化程度影响人机印象效果起中介作用。

H2.1 感知智能与感知心灵对拟人化程度影响人机印象鲜明度起中介作用。

H2.2 感知智能与感知心灵对拟人化程度影响人机印象全面度起中介作用。

H2.3 感知智能与感知心灵对拟人化程度影响人机印象好感度起中介作用。

H3 任务导向型(相对于交际导向型)人机对话情境下,感知智能对拟人化程度影响人机印象效果起更强的中介作用。

H3.1 任务导向型(相对于交际导向型)人机对话情境下,感知智能对拟人化程度影响人机印象鲜明度起更强的中介作用。

H3.2 任务导向型(相对于交际导向型)人机对话情境下,感知智能对拟人化程度影响人机印象全面度起更强的中介作用。

H3.3 任务导向型(相对于交际导向型)人机对话情境下,感知智能对拟人化程度影响人机印象好感度起更强的中介作用。

H4 交际导向型(相对于任务导向型)人机对话情境下,感知心灵对拟人化程度影响人机印象效果起更强的中介作用。

H4.1 交际导向型(相对于任务导向型)人机对话情境下,感知心灵对拟人化程度影响人机印象鲜明度起更强的中介作用。

H4.2 交际导向型(相对于任务导向型)人机对话情境下,感知心灵对拟人化程度影响人机印象全面度起更强的中介作用。

H4.3 交际导向型(相对于任务导向型)人机对话情境下,感知心灵对拟人化程度影响人机印象好感度起更强的中介作用。

综上,实验的理论模型如图1所示。

图片

三、实验设计与实验实施穿戴技术:从“使用工具”到“成为工具”

实验采用2(低度拟人化/高度拟人化)×2(任务导向型情境/交际导向型情境)的组间实验设计(表2)。

图片

为避免既有人机印象干扰被试判断,实验未使用现实中已存在的无实体对话机器人,而是使用虚构的“机器小语”作为对话对象,并按照前文所述拟人化程度与对话情境的操作定义进行具体对话设计。实验刺激材料以基于手机端无实体对话机器人对话界面的聊天长图呈现。

在预实验阶段,通过问卷星调研平台招募60名18—40岁且受教育程度为本科及以上的被试,对不同拟人化程度的对话材料进行拟人化程度评分和对话情境判断。结果显示,低度拟人化实验刺激材料的拟人化程度评分显著低于高度拟人化材料的评分(M低拟=4.883,M高拟=8.250,t=8.312,p<0.001),表明实验对拟人化程度的操纵有效;设定为“任务导向型”和“交际导向型”的对话材料分别被判断为相应类型的正确率均为100%,表明实验对对话情境的操纵有效。

正式实验采用在线实验的形式,于2023年10月8日至10日在问卷星调研平台实施。被试者依旧限定在18—40岁且受教育程度在大学及以上的人群。被试者将随机分配至任一实验组,阅读并填写含不同实验刺激材料的问卷。问卷分为三个部分:第一部分首先介绍填答要求与信息保密承诺,其次描述与对话主题相匹配的实验情境,接着呈现人机对话长图,要求被试者仔细阅读后对拟人化程度和对话情境进行评分和判断;第二部分要求被试者根据人机对话情况填写感知智能、感知心灵、人机印象测量量表;第三部分对被试者的人机对话经验、人口特征进行调查。

四、数据分析

在线实验期间,共计回收问卷230份,经核查后确认有效样本206份,有效回收率达90%。其中,男性被试比例为40%(82名),女性被试比例为60%(124名)。各实验组被试分布情况如表2所示。

正式实验数据显示,对拟人化程度(M低拟=4.456,M高拟=7.986,t=15.001,p<0.001)和对话情境(r实验情境与判定情境=0.981,p<0.001)的操纵均有效。感知智能、感知心灵及人机印象的克朗巴赫系数α(Cronbach’s α)分别为0.820、0.944和0.953,表明3个变量的量表具有理想的内部一致信度。同时,探索性因子分析的结果显示,KMO值为0.934,Bartlett球形检验显著(p<0.001),通过主成分法提取特征值大于1的因子,旋转后的成分矩阵显示各题项在所属因子上的载荷均高于0.5,可见量表各题项均有较高效度。

(一)拟人化程度与对话情境对人机印象效果的影响分析

本研究使用SPSS26.0软件,采取双因素方差分析检验拟人化程度与对话情境对人机印象形成效果的影响是否显著。数据结果表明,拟人化程度与对话情境仅对印象好感度具有显著的交互效应(F=5.089,p=0.025),假设H1.3得到支持。使用EMMEANS语句进一步对简单效应进行分析后发现,无论对话情境为任务导向型还是交际导向型,拟人化程度的增强均能提升印象好感度,但交际型情境的提升幅度更大(F任务=47.172,M低拟=4.882,M高拟=6.115,p<0.001;F交际=101.176,M低拟=4.098,M高拟=5.904,p<0.001)。若将拟人化程度限定为低度拟人化,任务型情境下的印象好感度显著高于交际型情境下的好感度(F低拟=18.902,M任务=4.882,M闲聊=4.098,p<0.001),但在高度拟人化条件下,不同情境下的好感度不具有显著差异(F高拟=1.402,M任务=6.115,M交际=5.904,p=0.238)。

对于印象鲜明度和印象全面度,拟人化程度与对话情境的交互效应均未显著呈现,但拟人化程度对以上两个因变量以及印象好感度均存在显著的正向主效应。具体而言,拟人化程度的增强能显著提升印象鲜明度(F=111.335,M低拟=1.282,M高拟=1.967,p<0.001)、印象全面度(F=4.088,M低拟=22.647,M高拟=23.510,p=0.045)和印象好感度(F=143.258,M低拟=4.490,M高拟=6.010,p<0.001)。

图片

图片

(二)感知智能与感知心灵对拟人化程度影响人机印象效果的中介作用分析

本研究使用SPSS26.0软件中的Process插件,采取Bootstrap方法检验感知智能与感知心灵对拟人化程度影响人机印象效果的中介作用。首先,选用模型4(样本量5000,置信区间95%)对感知智能与感知心灵的并行中介作用进行检验。结果显示,感知智能与感知心灵对拟人化程度影响印象鲜明度和印象好感度均起到显著的中介作用,假设H2.1和H2.3得到支持。同时,由对比间接效应可知,在拟人化程度影响印象好感度的路径中,感知智能比感知心灵发挥更强的中介作用(β感智-感心=0.315,LLCI =0.018,ULCI=0.621)(表4)。

图片

其次,选用模型8(样本量5000,置信区间95%)考察对话情境对感知智能与感知心灵中介作用的影响。当拟人化程度为自变量,印象鲜明度和印象好感度依次为因变量,感知智能为中介变量,对话情境为调节变量时,有调节的中介模型均不具有显著性。但若将中介变量替换为感知心灵而其余不变时,统计结果显示,对于印象鲜明度和印象好感度,有调节的中介模型均具有显著性。具体而言,无论对于印象鲜明度还是印象好感度,交际型情境下感知心灵的中介作用均显著高于任务型情境(β鲜明(感心-感智)=0.116,LLCI =0.009,ULCI=0.245;β好感(感心-感智)=0.301,LLCI =0.018,ULCI=0.594),假设H4.1、H4.3得到支持(表5)。

图片

五、解释与讨论

实验结果表明,拟人化程度对人机印象形成效果(鲜明度、全面度、好感度)存在显著的正向主效应,且在交际导向型情境下拟人化程度的增强对印象好感度的提升幅度更大。其中,在拟人化程度正向影响印象鲜明度和印象好感度的路径中,感知智能与感知心灵均起到显著的中介作用;而对于印象好感度而言,感知智能比感知心灵发挥了更强的中介作用。此外,交际型情境下感知心灵对于拟人化程度影响印象鲜明度与印象好感度的中介作用均显著高于任务型情境。研究假设H1.3、H2.1、H2.3、H4.1、H4.3得到支持。以下分别进行讨论。

(一)拟人化程度对人机印象形成效果的正向主效应

实验发现拟人化程度对人机印象形成效果具有显著的正向主效应,即随着拟人化程度的加深,使用者将对无实体对话机器人形成更为鲜明、全面、正面的印象。显然,这一发现与关于实体机器人的“恐怖谷效应”高度相关,但却从人机印象效果的鲜明度、全面度和好感度三个维度上呈现出与“恐怖谷效应”完全相反的结果。

首先,印象好感度正是人们在面对实体机器人时所产生的“恐怖谷效应”最主要的衡量标准之一。“恐怖谷效应”所对应的变量直译是亲和感(しんわかん),有学者综合日语专家及英语母语者意见提出将之译为“likeability”(好感度)。也有学者提出可从情感效价(emotional valence)与熟悉感(familiarity)两大指标来理解“恐怖谷效应”中的人类感知,其中前者是指由机器人对象引发的感知者情感的正负性,后者则指感知者感受到机器人对象与自己所熟悉的另一对象(例如观察者自己)具有相似特质。可以看到,亲和感和情感效价均属于本研究中的印象好感度范畴。而本研究关于印象好感度的数据结果显示,对于非实体的对话机器人而言,高度拟人化并不会导致这一层面产生“恐怖谷效应”。

其次,印象鲜明度和印象全面度也是“恐怖谷效应”的重要表现方面。已有研究发现,分类困难会引发消极心理反应。当人机印象鲜明度或是全面度不高,也即总体印象模糊或印象点极少时,就极有可能导致人类使用者对社交机器人的分类困难,从而引发消极心理反应,助推“恐怖谷效应”的产生。但是,本研究的结果表明,对于非实体的对话机器人而言,高度拟人化会提升人机印象鲜明度与全面度,而在印象尽可能鲜明、全面的基础上人类使用者更有可能产生前文提及的熟悉感,从而削弱甚至避免人与实体机器人互动时产生的“恐怖谷效应”。

此外,实验还发现对话情境仅在拟人化程度对人机印象好感度的影响中起到调节作用,在交际型情境中拟人化程度对印象好感度的提升比任务型情境中更大。这一发现意味着,交际型情境下的高度拟人化更有可能消解“恐怖谷效应”。已有关于智能语音助手的研究表明,拥有不同类型的人机关系(即对话情境)用户,其生成智能语音助手视觉意象的清晰度不同,对智能语音助手感官信息加工精细度不同,从而导致共有型人机关系下智能语音助手虚拟化身呈现对听觉意象清晰度的冲突效应,或是交换型人机关系下智能语音助手虚拟化身呈现对听觉意象清晰度的补偿效应。也即是说,对话情境在拟人化程度对人机印象鲜明度的影响中也起到调节作用。但本实验数据却未对此结论提供支持。造成这一差异的原因可能是该研究的对象为智能语音助手而非本研究所研究的基于文本交流的社交机器人,在交际型情境中能依靠语音自有的丰富情感讯息给人以生动鲜明的印象,而后者囿于纯文本交流的限制无法做到这一点。因此,在两种对话情境下,使用者获取到的副语言线索差别不大,导致拟人化程度变化对印象鲜明度的影响不存在显著差异。

结合实验发现不妨尝试给出以下解释:以文本输出为主要互动方式的无实体对话机器人,可能提供了比实体机器人多得多的高度拟人化的言语线索,而这些言语线索意味着更为丰富的内容,以及更为丰富的表达,从而使得应用者更容易清晰、全面地感知其个性特质(也即提升了印象鲜明度和全面度),再加上其虚拟外观可以实现较之实体外观更为高度的拟人化,使得整体印象好感度能够达到一个较高的水平,因此避免了“恐怖谷效应”的发生。

(二)感知智能与感知心灵对拟人化正向影响人机印象形成效果的中介作用

实验发现,在拟人化程度正向影响印象鲜明度和印象好感度的路径中,感知智能与感知心灵均起到显著的中介作用;而对于印象好感度而言,感知智能比感知心灵发挥了更强的中介作用。

这一发现说明:其一,拟人化程度对人机印象效果的影响路径是多元的,至少通过使用者感知到对话机器人的智能水平和是否拥有思想或情感这两条路径对印象鲜明度和好感度产生影响。这两种机制恰好对应了人际交往中“解读心智”和“心灵感知”两种认知他人的方式,前者多用于与他人的交换关系,有助于人们更好地适应充满异己他人的社会环境,而后者仅服务于人际亲和性,是与同己他人心理同享的必要条件。不难看出,人机印象与人际印象形成的心理过程存在一定相似性。

其二,拟人化更多地通过感知智能而非感知心灵影响人机印象好感度,此时又体现出与人际印象形成的区别。事实上,这恰恰是社交机器人工具性的体现。在现实社会的人际交往中,人们常以智商和情商评估他人能力,但情商对于交流沟通而言更为重要(尤其是在高语境社会中),故人们对健全成年人的好感度往往更多地来源于其情商。而对于基于生成式AI的对话机器人而言,拟人化却更多地通过感知智能来影响好感度,这说明人们仍然更倾向于将其视为工具和服务提供者,重视其解决问题的能力。

实验结果还显示,交际型情境下感知心灵对于拟人化程度影响印象鲜明度与印象好感度的中介作用均显著高于任务型情境。这一结果表明,当人们与对话机器人进行朋友式的聊天时,拟人化主要通过人们对其思想、情感或者说“生命度”的感知来影响印象鲜明度和印象好感度。这与已有研究“拟人化倾向对感知心灵具有显著积极影响”的结论相一致,且进一步探明了从感知心灵到人机印象效果间的影响路径。曾有实证研究发现感知心灵与社交线索对人机交流体验具有交互影响,而本研究实验则发现感知心灵在人机交流的感知过程中起到中介作用。由此可知,感知心灵不仅可以作为调节因素,也可以发挥中介作用影响人们在人机传播中的反应,其具体作用需视研究情境而定。

值得思考的是,本研究的另一假设“任务导向型(相对于交际导向型)人机对话情境下,感知智能对拟人化程度影响人机印象效果起更强的中介作用”未得到数据支持。按照经验常理,在任务型情境下使用者往往基于某一需要解决的问题或完成的任务与对话机器人展开对话,而其内核AI的智能水平很大程度上决定了其在处理和解决问题方面的实际效用,正如曾有研究表明的那样,感知智能能够正向影响感知有用性,进而提高用户对个人智能助理的使用意愿。因此,使用者理应更多地启动感知智能这一中介路径,但本研究却发现感知智能在任务型情境和交际型情境下的中介作用没有显著差异。这只能说明,不仅感知智能在两种情境下的人机对话中都很重要,同时感知心灵在任务型情境下也很重要。换言之,即便人们从功利性角度出发将社交机器人视作“工具人”进行对话,其是否能给人以具有思想的感觉同样被看重。例如,有人认为ChatGPT只是对人类知识图谱的统计学模拟,也有人认为存在“人类和AI主体地位的争议问题”。这一发现彰显出人类与社交机器人对话时对功能性和社交性的双重期望,而这种双重期望不仅从侧面反映出人与技术互动中常见的“人类中心主义”视角,而且也投射出人机界限日益模糊的趋势。未来的研究可进一步探索这一心理机制。

六、结论与反思

基于以上讨论梳理可以看到,4个理论假设中有3个得到了支持。由此可得到本研究的主要结论:拟人化程度提升会使人们对基于生成式AI的对话机器人形成更为鲜明、更为全面和正面的印象;交际型情境中拟人化程度对印象好感度的提升比任务型情境中更大。这意味着,在人与无实体机器人互动中存在着和人与实体机器人互动时不同的“反恐怖谷效应”。其中,对智能与心灵的感知是“反恐怖谷效应”生成路径上的两个重要中间机制,并且对于效应的核心维度印象好感度而言,目前对智能的感知更为重要。

这一结论在一定程度上回应了学界在无实体对话机器人兴起后产生的担忧。例如,有接近45%的被调查者认为ChatGPT通过了图灵测试;有学者认为AI正在引发“图灵革命”;有学者认为ChatGPT呈现出的偏差性、不可靠性、鲁棒性、有毒性等容易诱发伦理风险;有学者认为与ChatGPT互动的感觉让人想到社交机器人著名的“恐怖谷”现象;有学者认为当人们意识到自己的可替代性和主体性困境,会将自己推向“AI恐怖谷”;也有学者认为ChatGPT带来的“恐怖谷效应”会激发人类维护自身尊严和文化世界观的远程恐怖管理防御等。尽管有必要保持警觉,也有必要基于不同的风险分类实施动态管理,但或许可以较为乐观地认为,在日常互动中,人们对高度拟人化的无实体对话机器人还是表现出了较好的适应性。这也在一定程度上揭示了未来人机共生的巨大潜力。

总之,本研究探索了生成式AI时代以ChatGPT为代表的无实体对话机器人拟人化如何改变人类对其的感知效果的问题,构建了相应的理论模型并予以了实证检验。这对目前人机互动、尤其是人与AI互动议题下为数较多的思辨性研究形成了补充。同时,由于“人工智能与人的嵌入性更高”,且人机交流伴随ChatGPT及类似应用的诞生将日益普及,因此研究结论有助于推进对智能传播时代下人机交往模式的深入理解,对“大语言模型的人机交互:主要关注人类和大语言模型交互的过程、心理动机、交互效果等方面的问题”这一亟待探索的研究方向提供了一些思考。

当然,本研究也存在一些局限。一是虽然发现了“反恐怖谷效应”,但其背后的原因尚需进一步挖掘;二是仅考察了对话情境这一个调节变量的影响,可能还存在其他影响因素有待探索;三是将切入点聚焦于拟人化程度,未考虑更多的角度;四是基于不同感官的交流方式对人机感知效果的影响可能有所差异,而本研究暂未考察。以上都有待未来研究的深入探讨。

作者:张放,四川大学新闻学院教授,四川成都610207;徐子涵,四川大学新闻学院博士研究生,四川成都610207

原文刊载于《新闻界》杂志2024年第5期,参考文献及注释详见原文

一键下载原文