AI手机另一面：滥用残障人士权限，用户隐私裸奔

一见财经

2024-12-27 12:16发布于天津

当AI接管手机，带给我们的究竟是便利还是毁灭？

10月30日，荣耀Magic7旗舰系列发布会上，荣耀CEO赵明用荣耀智能助手YOYO “全自动” 点咖啡一炮走红，YOYO理解了他的意图，并点开美团、点击商户、选择商品、跳转至支付页面，最后由用户确认支付。

荣耀还展示了“一句话取消自动扣款”，YOYO进入支付宝的自动扣款页面，关闭App的付费订阅。

除了荣耀，在11月29日大模型企业“智谱”的Open Day上，CEO张鹏展示了其手机助手产品AutoGLM，一句“帮我在智谱开放日的群聊里发个两万的红包，数量为一百个，名字为AI给你发的第一个红包”，即可让AI打开微信、选择红包数量、总金额、更改红包命名，最后输入密码发送。

这两年，在AI浪潮下，国产安卓手机厂商积极在手机上部署大模型，如荣耀的魔方大模型、vivo蓝心大模型、OPPO安第斯大模型等，最集中的表现就是手机里的各种智能助手。

有了大模型的加持，智能助手变得以前更聪明，除了能更好地回答问题，手机厂商还希望将AI变为助手，辅助用户完成各种复杂操作。

不过，在用户获得便利性的同时，某些手机为了实现“智能化”另辟蹊径，导致手机权限被滥用，用户隐私“裸奔”。

滥用无障碍接口，不走正道走“盲道”

国产安卓手机厂商在宣传大模型加持下的“AI手机”时，绝大多数只谈能力，却未告知其操作第三方App的技术原理以及给用户带来的隐私风险。

有券商研究报告指出，目前AI手机智能助手调用第三方App，主要有两条技术路线：

路线一：通过意图框架实现。通过API调用应用，实现跨应用功能。

具体来说，就是手机厂商与App开发企业协商、以合法的API接口的形式接入。比如苹果与华为，二者均在开发者官网推出了用户意图框架的合作方案，设计了统一的合作模式，并提供了开发者文档的指引，让开发者自主选择是否接入、如何接入，开放哪些场景与接口。

路线二：通过纯视觉方案实现。无需第三方App同意，直接调用安卓系统的无障碍等系统级权限。

具体做法是，安卓手机厂商以多模态大模型技术配合无障碍权限，先读取屏幕内容，再以模拟用户点击的方式代替用户操作，实现手机智能助手代替用户接管手机，以达到调用APP功能的目的。

无障碍（Accessibility API）是安卓操作系统给残障人士专设的特殊接口，Accessibility API允许应用程序读取屏幕内容并代替用户执行输入，用户开启后可以辅助用户朗读屏幕、语音控制点击按键等。

业内人士表示，“无障碍”近乎于系统级别的最高权限，开启后可以向善，也可以作恶。一旦这项权限遭到恶意调用，就如同手机大门敞开，用户数据安全与隐私保护体系沦为“马奇诺防线”。

这些年，滥用无障碍接口的案例很多，同时也是相关部门打击的重点。

2021年，百豪公司利用无障碍接口及监听消息通知等功能，开发出自动抢红包外挂“红包猎手”“多多抢红包”，后被杭州铁路运输法院认定为违反《中华人民共和国反不正当竞争法》第十二条第（四）项规定，构成不正当竞争，一审判处赔偿腾讯公司70万元，二审、终审均维持原判。

另据福建省龙岩市中级人民法院(2019)闽08刑终119号刑事判决书中记录，三位被告开发的应用“超级雷神”，利用无障碍功能实现了“自动抢红包”等功能，构成侵入计算机信息系统程序罪，最终三位被告均获刑三年。

目前，某些国产安卓手机厂商通过滥用无障碍接口，实现手机的AI功能，根本原因是野心大于实力。

对于很多国产安卓手机厂商来说，由于出货量小，各家用户意图框架不统一，接入开发工作量大等原因，缺乏和app厂商谈判的筹码，只有少数App愿意接入，让其调用API。

不过，国产安卓手机厂商一方面不满足于自有App的有限场景，另一方面又不甘心与一家家App企业慢慢谈合作，同时还希望快速上马热门场景，深入支付宝、美团、微信等头部应用的重点功能。

于是，部分手机厂商冒险选择了“路线二”，即调用无障碍接口，通过读屏和模拟用户点击的方案调用第三方App。

伤害用户隐私的威力堪比核武器

非法调用无障碍接口并非新兴事物。

早在2023年手机大模型流行前，很多智能助手已经可以实现一句话发微信等功能。通过调用无障碍接口、读取屏幕内容、模拟点击来实现“智能化”，只是以前相对隐蔽、范围有限。

从技术上讲，手机“读屏”有两条实现路径：一条是明面上的读屏，另一条则是API Hook（API钩子）。两者都需要获取无障碍、root等系统级权限，更深度侵入手机个人隐私。

读屏是仿照人的理解方式，眼睛看到信息、大脑处理信息；而API Hook是操作系统的特权，通过读取跑在系统上的App运行情况、App调用了哪些系统控件，来判断当前处于什么App页面、页面上有哪些App信息。

通俗地说，读屏相当于手机在前台“看懂”了屏幕信息，API Hook是手机在后台“监控”了APP运行信息。两种方案综合运用，可以共同帮助AI理解手机里的内容、完成不经App许可的功能调用。

2023年以前，手机大模型没有被广泛应用前，这种侵犯用户隐私的方式精度低，范围也不大，但随着这两年大模型的盛行，多模态大模型能让系统更好地理解当前屏幕内容。

如果说以前的AI相对“智障”，侵害用户隐私的威力只是手榴弹，那么有了大模型能力的识屏就相当于核武器。

现在，也许你只是请手机帮忙发条微信，但手机却要读取你屏幕上的所有信息、照片、聊天记录，并可以通过大模型分析，获取身份、位置、支付等各类敏感信息。此时手机上的个人数据大门敞开。

另外，借用API Hook技术，系统后台在读取App后台运行界面时，不仅局限于读取某一屏的内容，而是会综合前后几屏、上下文的内容，在用户不知不觉中，个人很可能已经泄漏。

拒绝AI“监视一切”刻不容缓

对于很多普通手机用户来说，只是体验到了智能手机带来的便利性，但对于数据安全和隐私泄露风险，却全然不知。

很多用户在使用手机过程中，根本就没有“授权意识”，即便手机有提示，用户授权了，但面对专业的技术名词，很多用户根本不清楚自己授予了什么权限吗？代价是什么？

手机厂商与App、用户间天然存在着极不对等的权力关系，就好比科幻小说《三体》中的农场主与火鸡，国产安卓手机厂商发展出各自高度定制化的操作系统，掌握远高于应用层的权限，面对用户更是有至高无上的“技术权力”。

在人工智能时代，随着手机智能助手的发展，上述权力关系进一步失衡，更多安全问题将浮出水面：未经许可调用App后，如果造成了数据泄漏，该由手机厂商还是App负责？哪些个人数据会被手机搜集、用于模型训练？用户不愿意被搜集个人数据可以吗？所谓的端侧大模型，如何真正保护用户个人数据不被传送给第三方云端大模型？

12月18日，对外经贸大学、中国人民大学、蚂蚁集团联合发布的《算法与AI大模型的用户认知调研报告（2024）》，基于8030份问卷的调研显示，52%的用户已在AI大模型中遭遇到了数据安全与隐私问题。另外，有60%的用户已经意识到，AI大模型最大的风险来源于不受控制的搜集用户隐私、个人资料。

今年6月，微软公司曾试图推出“Recall”（恢复）功能，原理与国产安卓厂商的读屏模拟点击方案高度雷同。每隔几秒，系统会对当前电脑屏幕截屏，再由AI识别、理解用户意图，为用户提供智能化操作。

然而，该功能在推出后便收到铺天盖地的“差评”，更有行业人士称其为“隐私噩梦”，遭到美国行业人士的集体抵制。出于对隐私风险的担忧，微软称将不会在新的个人电脑Windows系统中“上新”Recall功能。

微软的计划流产了，但国产安卓手机厂商却把这一切变成了现实，在为用户提供“智能体验”的同时，也打开了潘多拉魔盒。

查看原图 492K