AI手机另一面:滥用残障人士权限,用户隐私裸奔

图片

当AI接管手机,带给我们的究竟是便利还是毁灭?

10月30日,荣耀Magic7旗舰系列发布会上,荣耀CEO赵明用荣耀智能助手YOYO “全自动” 点咖啡一炮走红,YOYO理解了他的意图,并点开美团、点击商户、选择商品、跳转至支付页面,最后由用户确认支付。

荣耀还展示了“一句话取消自动扣款”,YOYO进入支付宝的自动扣款页面,关闭App的付费订阅。

除了荣耀,在11月29日大模型企业“智谱”的Open Day上,CEO张鹏展示了其手机助手产品AutoGLM,一句“帮我在智谱开放日的群聊里发个两万的红包,数量为一百个,名字为AI给你发的第一个红包”,即可让AI打开微信、选择红包数量、总金额、更改红包命名,最后输入密码发送。

这两年,在AI浪潮下,国产安卓手机厂商积极在手机上部署大模型,如荣耀的魔方大模型、vivo蓝心大模型、OPPO安第斯大模型等,最集中的表现就是手机里的各种智能助手。

有了大模型的加持,智能助手变得以前更聪明,除了能更好地回答问题,手机厂商还希望将AI变为助手,辅助用户完成各种复杂操作。

不过,在用户获得便利性的同时,某些手机为了实现“智能化”另辟蹊径,导致手机权限被滥用,用户隐私“裸奔”。

滥用无障碍接口,不走正道走“盲道”

国产安卓手机厂商在宣传大模型加持下的“AI手机”时,绝大多数只谈能力,却未告知其操作第三方App的技术原理以及给用户带来的隐私风险。

有券商研究报告指出,目前AI手机智能助手调用第三方App,主要有两条技术路线:

路线一:通过意图框架实现。通过API调用应用,实现跨应用功能。

具体来说,就是手机厂商与App开发企业协商、以合法的API接口的形式接入。比如苹果与华为,二者均在开发者官网推出了用户意图框架的合作方案,设计了统一的合作模式,并提供了开发者文档的指引,让开发者自主选择是否接入、如何接入,开放哪些场景与接口。

路线二:通过纯视觉方案实现。无需第三方App同意,直接调用安卓系统的无障碍等系统级权限。

具体做法是,安卓手机厂商以多模态大模型技术配合无障碍权限,先读取屏幕内容,再以模拟用户点击的方式代替用户操作,实现手机智能助手代替用户接管手机,以达到调用APP功能的目的。

无障碍(Accessibility API)是安卓操作系统给残障人士专设的特殊接口,Accessibility API允许应用程序读取屏幕内容并代替用户执行输入,用户开启后可以辅助用户朗读屏幕、语音控制点击按键等。

图片

业内人士表示,“无障碍”近乎于系统级别的最高权限,开启后可以向善,也可以作恶。一旦这项权限遭到恶意调用,就如同手机大门敞开,用户数据安全与隐私保护体系沦为“马奇诺防线”。

这些年,滥用无障碍接口的案例很多,同时也是相关部门打击的重点。

2021年,百豪公司利用无障碍接口及监听消息通知等功能,开发出自动抢红包外挂“红包猎手”“多多抢红包”,后被杭州铁路运输法院认定为违反《中华人民共和国反不正当竞争法》第十二条第(四)项规定,构成不正当竞争,一审判处赔偿腾讯公司70万元,二审、终审均维持原判。

另据福建省龙岩市中级人民法院(2019)闽08刑终119号刑事判决书中记录,三位被告开发的应用“超级雷神”,利用无障碍功能实现了“自动抢红包”等功能,构成侵入计算机信息系统程序罪,最终三位被告均获刑三年。

目前,某些国产安卓手机厂商通过滥用无障碍接口,实现手机的AI功能,根本原因是野心大于实力。

对于很多国产安卓手机厂商来说,由于出货量小,各家用户意图框架不统一,接入开发工作量大等原因,缺乏和app厂商谈判的筹码,只有少数App愿意接入,让其调用API。

不过,国产安卓手机厂商一方面不满足于自有App的有限场景,另一方面又不甘心与一家家App企业慢慢谈合作,同时还希望快速上马热门场景,深入支付宝、美团、微信等头部应用的重点功能。

于是,部分手机厂商冒险选择了“路线二”,即调用无障碍接口,通过读屏和模拟用户点击的方案调用第三方App。

伤害用户隐私的威力堪比核武器

非法调用无障碍接口并非新兴事物。

早在2023年手机大模型流行前,很多智能助手已经可以实现一句话发微信等功能。通过调用无障碍接口、读取屏幕内容、模拟点击来实现“智能化”,只是以前相对隐蔽、范围有限。

从技术上讲,手机“读屏”有两条实现路径:一条是明面上的读屏,另一条则是API Hook(API钩子)。两者都需要获取无障碍、root等系统级权限,更深度侵入手机个人隐私。

读屏是仿照人的理解方式,眼睛看到信息、大脑处理信息;而API Hook是操作系统的特权,通过读取跑在系统上的App运行情况、App调用了哪些系统控件,来判断当前处于什么App页面、页面上有哪些App信息。

通俗地说,读屏相当于手机在前台“看懂”了屏幕信息,API Hook是手机在后台“监控”了APP运行信息。两种方案综合运用,可以共同帮助AI理解手机里的内容、完成不经App许可的功能调用。

2023年以前,手机大模型没有被广泛应用前,这种侵犯用户隐私的方式精度低,范围也不大,但随着这两年大模型的盛行,多模态大模型能让系统更好地理解当前屏幕内容。

如果说以前的AI相对“智障”,侵害用户隐私的威力只是手榴弹,那么有了大模型能力的识屏就相当于核武器。

现在,也许你只是请手机帮忙发条微信,但手机却要读取你屏幕上的所有信息、照片、聊天记录,并可以通过大模型分析,获取身份、位置、支付等各类敏感信息。此时手机上的个人数据大门敞开。

另外,借用API Hook技术,系统后台在读取App后台运行界面时,不仅局限于读取某一屏的内容,而是会综合前后几屏、上下文的内容,在用户不知不觉中,个人很可能已经泄漏。

拒绝AI“监视一切”刻不容缓

对于很多普通手机用户来说,只是体验到了智能手机带来的便利性,但对于数据安全和隐私泄露风险,却全然不知。

很多用户在使用手机过程中,根本就没有“授权意识”,即便手机有提示,用户授权了,但面对专业的技术名词,很多用户根本不清楚自己授予了什么权限吗?代价是什么?

手机厂商与App、用户间天然存在着极不对等的权力关系,就好比科幻小说《三体》中的农场主与火鸡,国产安卓手机厂商发展出各自高度定制化的操作系统,掌握远高于应用层的权限,面对用户更是有至高无上的“技术权力”。

在人工智能时代,随着手机智能助手的发展,上述权力关系进一步失衡,更多安全问题将浮出水面:未经许可调用App后,如果造成了数据泄漏,该由手机厂商还是App负责?哪些个人数据会被手机搜集、用于模型训练?用户不愿意被搜集个人数据可以吗?所谓的端侧大模型,如何真正保护用户个人数据不被传送给第三方云端大模型?

12月18日,对外经贸大学、中国人民大学、蚂蚁集团联合发布的《算法与AI大模型的用户认知调研报告(2024)》,基于8030份问卷的调研显示,52%的用户已在AI大模型中遭遇到了数据安全与隐私问题。另外,有60%的用户已经意识到,AI大模型最大的风险来源于不受控制的搜集用户隐私、个人资料。

今年6月,微软公司曾试图推出“Recall”(恢复)功能,原理与国产安卓厂商的读屏模拟点击方案高度雷同。每隔几秒,系统会对当前电脑屏幕截屏,再由AI识别、理解用户意图,为用户提供智能化操作。

然而,该功能在推出后便收到铺天盖地的“差评”,更有行业人士称其为“隐私噩梦”,遭到美国行业人士的集体抵制。出于对隐私风险的担忧,微软称将不会在新的个人电脑Windows系统中“上新”Recall功能。

微软的计划流产了,但国产安卓手机厂商却把这一切变成了现实,在为用户提供“智能体验”的同时,也打开了潘多拉魔盒。