误解导致恐惧
「刚打电话聊到想买汽车香薰,结果打开电商平台就看到推荐」
「打算出国留学后,开始收到很多留学咨询机构的信息」
「手机上出现跑鞋广告,它怎么知道我要奖励自己一双跑鞋」
……
聊什么就推什么,怎么会有这种巧事?产生这些疑问后,人们往往会联想到一个原因:是不是我的手机被监听了?当然,这个判断会让用户心生恐惧。
但实际情况呢?其实,我们的恐惧来源于对个性化广告运作机制的一些误解。
前提:用户是个复杂行为体
是我们的手机被监听了吗?如果在网上搜索,你会看到不少信息将「监听」这件事讲得有声有色。
但至少,在广告行业中通过打开麦克风24小时收录你的声音,再将这些信息用于广告投放,这件事不怎么具有性价比。
2022年,社科院与《财经》杂志联合发布了「个性化广告合规发展研究报告」。其中对这个问题有专门澄清,大致提到监听有三个风险:
第一,成本风险,监听得来的非结构化信息需要大量清洗才可使用,处理成本非常高;
第二,暴露风险,监听会导致设备异常发热和耗电速度快等问题,极易被用户察觉;
第三,处罚风险,监听一旦暴露将带来巨额罚款甚至刑罚,对企业有极大的震慑作用。
既然不是监听,为什么会「聊什么推什么」?这就与「匹配机制」有关。
首先,我们需要明确一点:用户是个复杂行为体。
怎么理解?就是我们在发起任何行动前往往会有多个前兆指标。思考一下,你在购买心仪的商品前会出现哪些行为?可能会搜索关键词或者刷到相关的短视频会不经意间多看一会儿、可能会加入购物车、可能会关注店铺账号、也可能会咨询客服。
在广告投放中,这些行为被称为预转化行为(pre-conversion),他们都被证明与最终购买显著相关。
但实际操作中,用户不太可能同时出现搜索、加车、关注和咨询这几种行为,企业也不用监测到这四种行为才发起行动(那通常意味着错过了推广时机)。往往只需出现一个预转化信号,企业就可以开始行动。
所以,我们可以将用户理解为一个复杂行为体,A、B、C、D等行为都可以推测出消费者需求E,只需其中一条通道就可以判定需求。
因此,即便你与朋友在聊天中透露出E,也不代表看到的广告就来自于「监听」,因为你的需求一定会发出多个前置信号(即便你未察觉)。所以,广告的精准匹配大概率来自用户其他已外显的行为,例如搜索、点击或者仅仅是单纯看完了某条信息或视频。
过程:程序分析群体而非个体
紧接着,你可能会产生疑问:这不还是围绕着我来做分析吗?
其实并不是。要理解清楚这个问题,我们可以将问题细剖成两个层面:「分析谁」以及「谁分析」。
在「分析谁」这件事上,广告行业是分析群体、而非盯着个体。
事实上,在精准定向中更具价值的并不是特定个体的数据,而是人群标签。比如,它并不是因为知道张三或李四对露营感兴趣,所以定向推送露营帐篷的广告;而是因为张三或李四被贴上了「露营兴趣人群」标签,才向所有贴上这个标签的消费者定向推送。换句话说,定向锚定的是标签,而不是个体。
为什么会有这样的变化?是因为通过标签定向更具效率。
举个例子,剧场会将门票分为池座和楼座两类,观众入场时需要通过不同的通道进入。但是在入口处,工作人员并不需要观众告知姓名或者身份证号去查询对应座席,而是直接通过不同类型的门票进行区分。所以,工作人员即便不清楚观众具体是谁,也能够精准引导观众入场。
这就是个性化广告运作的底层机理。他并不仰赖于特定个体数据,而是直接依靠标签完成人群定向。而这么做不仅出于对用户隐私的保护,更是出于效率提升的目的——通过标签定向更容易批量操作,省去了个体定向的繁琐。
在「谁分析」这件事上,广告业也基本实现了程序化,即通过程序、而非依赖某个具体工作人员进行分析。其中,程序化广告是目前跨平台广告应用最普遍也最成熟的投放模式。
中国电子技术标准化研究院网安中心测评实验室副主任何延哲对何谓「程序化广告」做过解释,他指出「程序化广告是由程序自动化完成广告采买和投放,并实时反馈投放分析的一种广告投放方式,实现了整个数字广告的自动化」。在程序化广告运作过程中,各大平台从受众匹配的角度,将众多版位的广告曝光机会同时发给买方,大家通过实时拍卖的方式来完成交易。
程序化广告运作需要遵从OpenRTB等行业协议,这可以理解为一套关于广告购买方与供应方之间如何进行信息交换的行业规范,而这些协议普遍规定从广告位出现到完成广告内容加载需要在100ms之内完成。简单来说,整个数字广告系统需要在眨眼之间完成所有计算工作。显而易见的是,这件事很难通过人来完成,只有程序才能达成这样的速度。由于程序化广告需要在转瞬即逝的极短时间内横跨多个主体、多个平台完成广告投放,这一套操作流程并不为行业以外的大众所熟知,所以难免让用户产生「聊什么推什么是因为被手机监听」的误解。
事实上,现实生活中也有很多例子可以印证,这样的误解并不成立。
譬如,北京互联网法院此前的一个判例,就能很好地说明。据公开资料显示,某短视频博主散布“VX被监听,1分钟教你关闭”等未经核实的内容,被北京互联网法院判定侵犯原告名誉权。法院认为,个性化广告已经成为了互联网广告的一种比较常见的模式,发生广告个性化推荐结果并不意味着App实施了监听。平台是根据用户的浏览偏好、使用记录等进行收集和标记,形成用户画像,并据此进行广告投放。由此可见,像微信这样的主流平台并不会通过“监听”用户来推送信息,大家也无需过分担忧。
所以,真实情况是程序在分析群体、而不是某个具体的人在处理个体数据。所以,在让风险可控这件事上,技术还在不断释放更多想象空间。
后手:让数据可用、不可见
技术机制的发展将「广告知人心」的风险大大降低,但法律和行业规范依然持续加码以提升数据安全性,「去标识化」是其中重要的一个举措。
《个人信息保护法》专门提到「去标识化」,指的是「个人信息经过处理,使其在不借助额外信息的情况下无法识别特定自然人的过程。」
举个例子,如果你在5月7日晚20点打开某视频软件观看了某部电视剧,这个信息完全能够将你归入某类群体,并据此实现广告精准匹配。但单靠这个数据却无法把它与你这个具体的人直接联系在一起,因为在这个时间点观看这部电视剧的不止你自己。
这便是去标识化,它已经成为广告业必须遵循的基本原则。
你可以将它理解为用户在参与一场「假面舞会」。每个人都带着面具,而他们的性格和行为都和这个面具相关联,这保证了人们在舞会中能够识别出那些性格相合的伙伴。但是,面具背后的真实身份在这个过程中被有效隐藏起来。在广告中,去标识化也能够达成相似的效果。
从技术机制上说,用户的各项属性数据,过去可能会和手机号等直接指向用户个体的ID数据绑定在一起;但是,为了实现去标识化,广告行业已经开始通过GAID等与设备绑定的广告标识符完成数据处理,从而在保证广告精准投放的同时为用户加一层保护,实现属性数据和个体ID数据的「解绑」。
当然,还有更多的隐私保护举措不断推出。例如,隐私计算技术近年来就在数字广告行业中被广泛应用,它的目标是在保护数据本身不对外泄漏的前提下尽可能实现数据的整合计算,最大程度实现数据价值释放与个人隐私保护平衡。
事实上,这一类型技术希望达成的结果可以总结为五个字:可用、不可见。当然,在越发严厉的合规环境下,更多前沿技术还在不断出现。
在当下,隐私保护确实是个越发敏感、也越发关键的议题,它关乎每一个人的基本权利。但从底层动机来看,我相信广告的未来在于向善生长:因为广告效果达成的前提,是不能成为用户的仇敌。
参考资料: