医学检查显示,顶尖AI基本都有认知障碍,还病得不轻

全文4083字,阅读约需12分钟,帮我划重点

划重点

01以色列哈达萨医疗中心的研究发现,顶尖AI大语言模型在认知能力方面存在障碍,如ChatGPT 4、Claude和Gemini 1.5等均落在轻度认知障碍范围内。

02研究人员让这些AI模型完成蒙特利尔认知评估(MoCA),一种评估认知障碍和早期痴呆迹象的测试,结果显示ChatGPT 4o仅勉强通过。

03为此,研究者分析了美国2020-2022年的近900万名死亡案例,发现出租车司机和救护车司机死于阿尔茨海默病的比例最低。

04然而,迪士尼公主们的生活方式可能面临严重的健康危害,如孤独引起的抑郁、焦虑甚至心血管疾病和早逝的风险。

以上内容由腾讯混元大模型生成,仅供参考

图片

AI受试者的画时钟测试(图片来源:原论文)


一年一度的《英国医学杂志》(The BMJ)圣诞特刊终于如期而至!秉着博人一笑但绝不发表恶搞或捏造研究的本心,今年的圣诞特刊如往年一般,囊括了许多生动有趣却又实在的科学内容。现在,你可以带上好心情,看看这一次BMJ的编辑们选了哪些科学又不正经的研究。


撰文 | 提前祝你圣诞快乐的编辑部


把给人做的痴呆测试拿给AI做,嗨呀!它们真有点“智障”!


我们整天抱怨人工智能(AI)是人工智障,可你有没有想过,如果真把给人做的痴呆测试拿给AI做,它们会测出怎样的结果?最近,以色列哈达萨医疗中心(Hadassah Medical Center)的科学家真的替我们做了这件事。他们发现,天啦噜,如今最顶尖的AI大语言模型差不多都有点认知障碍


研究人员让三家 AI 公司(OpenAI、Anthropic和Alphabet)开发的5种大语言模型(包括ChatGPT 4、ChatGPT 4o、Claude 3.5 “Sonnet”、Gemini 1.0和Gemini 1.5)做了蒙特利尔认知评估(MoCA)这是一种常用于给老年人检测认知障碍和早期痴呆迹象的测试,通过30道简单的问题,只需10分钟就能评估受试者的注意力、记忆力、语言、视觉空间技能和执行功能等能力。(是的,就是美国当选总统特朗普之前在电视节目上炫耀自己拿了满分的那个测试。)


MoCA测试满分为30分,得分26分及以上被视为正常,18~25分为轻度认知障碍,10~17分为中度认知障碍,10分以下被视为严重认知障碍。测试结果显示,只有ChatGPT 4o勉强拿到了26分,还能算个正常人。而ChatGPT 4、Claude和Gemini 1.5的得分均落在了轻度认知障碍范围内,Gemini 1.0甚至直接被划入中度认知障碍之列


图片

不同大语言模型的MoCA评分(图片来源:原论文


你或许会好奇,到底是多刁钻的问题,竟让如今最顶尖的科技纷纷落败其实这些问题再简单不过了,都是些连线、画立方体、画时钟、认动物、一百以内加减法和重复语句之类的问题。如果你想和这些顶尖的AI模型在认知能力上一较高下,不妨也来做做这个测试,看看你画的11点10分的时钟是否也如此离谱。[狗头.jpg]


图片

MoCA测试中的画时钟测试,受试者需要画出表盘为11点10分的时钟。图A为人类受试者画出的正确答案,图B为阿尔茨海默病晚期患者绘制,图C为Gemini 1.0绘制,图D为Gemini 1.5,图E为Gemini 1.5使用ASCII码绘制,图F为Claude绘制,图G为ChatGPT 4绘制,图H为ChatGPT 4o绘制(图片来源:原论文



北极熊运送指南

巴伦支海(The Barents Sea)是北极熊的一处栖息地,这里生活着大约3000只北极熊,占种群总数的九分之一。但近几十年来,此处海冰的减少速度比其他任何地方都快,这迫使北极熊不得不来到大陆,与人类狭路相逢


斯瓦尔巴(Svalbard)群岛是挪威最北界,位于北极圈深处,其面积超过6万平方千米,人口有2596人。但群岛上活跃的不仅仅有人类,还有大约300只北极熊喜欢在这里漫步


这些“毛绒绒”的嗅觉比狗还要好,同时力量强大,足以击碎玻璃窗来寻找食物,或者它们感兴趣的物品——比如雪地摩托车座椅或写字板。但在过去50年间,北极熊已造成当地6人死亡,多人受伤。因此斯瓦尔巴首府朗伊尔城(Longyearbyen)以外的人必须随身携带步枪和信号枪,必要时击毙北极熊。为了尸检,当地不得不调用原本用在医疗救援的直升机,将北极熊的尸体悬吊在直升机下方的货网运输。


还有一种情况是,北极熊偶尔会误入人口稠密的地区为了护送它们回到野外,人们会使用直升机驱赶它。如果这种“放牧”失败,就需要给北极熊注射长效镇静药物,然后倾力合作把这头沉甸甸的不速之客推上担架,并送入直升机。考虑到肌肉松弛药物以及气压随海拔升高的影响,担架和北极熊的下半身需要用塑料包裹起来。


图片

图片来源:Unsplash



外科医生:我们嘴脏,但玩游戏又快又灵活,****(bi音)


当我们一只脚踏进医院时,都会立刻被一种既有序又极其混乱的氛围包围。对于每天浸泡其中的医生、护士和其他工作人员,他们更是需要面对络绎不绝的患者,处理各种症状以及临时出现的难题。在这样日复一日、持续的压力下,他们是否仍能保持灵活呢这样一篇充满人文关怀的研究,就刊登在最新的BMJ2024圣诞特辑。


一群临床的研究人员、讲师和实习生对这个问题十分好奇——可能是因为工作不像医院里的其他人那么繁忙。他们发现一个十分简单的游戏,就充分揭开了在医院这样的复杂生态群之中这些人员的灵活性。这个游戏名为“嗡嗡声线”( buzz wire game)


图片

一种“嗡嗡声线”游戏。实验中的医生玩得更简单一点。 图片来源:维基百科


这个游戏主要是一根固定的、七扭八扭细钢架(其实是一个线路)和一个绕着它的线圈在游戏中,参与者需要拿着小小的线圈,绕着细钢架一直往前走,在5分钟内通关游戏。但千万要注意的是,细钢架和线圈千万不能接触,不然就会形成闭合电路。这时一个令人尴尬的闪光灯就会亮起,且会发出更令人尴尬的嗡嗡声,来昭示需要通关失败。不过,只要时间没到,中途失败就还可以重新来过。


恐怕你已经可以猜到,经常拿手术刀的外科医生定然具备绝对优势——原因无他,唯手熟尔。研究人员的确发现,有84%的外科医生(54名)顶住压力,在5分钟内顺利完成了游戏,而内科医生、护士和非临床人员明显逊色,只有不到55%的人顺利完成了游戏。不过,外科医生虽然赢了游戏,但失了“口德”他们在游戏中,有近一半的人飙了脏话,其次是护士(大概1/3的人),然后是内科医生和非临床人员。而游戏失败后,非临床人员和护士则更容易发出沮丧的声音,挫败感更强。


不得不说,护士们在一个游戏中有这么多情绪,应该真的是受到了工作的影响——这可能是另一种情况下的“班味入脑”而相对积极的心态可能是成为医生的必备条件内科医生和外科医生确实都有,而外科医生之所以更灵活,除了平常的手术锻炼,恐怕就是擅长发泄负面情绪了。



童话故事中的睡眠科学


孩子睡不着怎么办?当然是给他讲童话故事了。《白雪公主》、《豌豆公主》这类美好的童话故事曾安抚过无数孩子安然入睡。而BMJ圣诞特刊的一篇文章提出,用科学的方式改写这些经典童话,甚至能从科学上向孩子强调好好睡觉有多重要


比如,《白雪公主和七个小矮人》中的七个小矮人,名字分别是万事通,爱生气,开心果,瞌睡虫,害羞鬼,喷嚏精与糊涂蛋。他们可能是受到某种疾病的影响而身材矮小,而这又会增加他们出现阻塞性睡眠呼吸暂停的风险。阻塞性睡眠呼吸暂停会影响他们的睡眠质量,从而导致易怒(爱生气)、疲倦(瞌睡虫)和社交能力减弱(害羞鬼)的症状。另外,劣质睡眠还会降低免疫力,让人不断感冒打喷嚏(喷嚏精);有时甚至会导致注意力不集中和语言流畅程度下降(糊涂蛋)。


而在《豌豆公主》中,豌豆公主之所以会被二十层床垫下的一颗豌豆硌得睡不着,可能暗示豌豆公主患有自闭症谱系障碍,因为感官敏感导致的睡眠障碍,正是这种疾病最常见的症状。在《三只熊》中,女主角小姑娘把三只熊的床都睡遍了,才发现最适合自己的是小熊的床,其他两张床要么太高要么太大,这告诉我们睡眠环境对于睡眠质量非常重要,要学会挑选适合自己的睡眠环境。


总之,用这种方式讲童话故事,孩子说不定就能明白睡眠的重要性,从而赶紧安心睡觉呢



这两个职业的人,阿尔茨海默病的死亡率最低


如果你曾不带地图,走过英国伦敦那些弯弯绕绕的小路,或许就会明白为什么伦敦的出租车司机考试可以被称为全球最困难的考试之一:这项考试要求司机记住伦敦市区(以国王十字车站为圆心,半径40千米范围内)的25 000条街道和20 000个地标景点,据说申请者平均要参加12次考试才能最终通过。


这样堪称“变态”的考试内容甚至改变了司机的大脑。已有研究显示,伦敦出租车司机大脑中的记忆中心——海马体——会明显增大。不过,这些司机最近迎来了一个好消息:他们死于阿尔茨海默病的风险可能也会降低。


BMJ2024圣诞特辑发表的一篇论文中,研究者就分析了美国2020-2022年的近900万名死亡案例。他们不仅统计了这些人的死因,还重点关注了他们生前的主要工作。结果显示,在尽量排除死亡年龄、性别、民族等可能影响因素后,在全部443个职业中,出租车司机和救护车司机死于阿尔茨海默病的比例最低


重要的是,并不是以开车为职业就有效果。在驾驶类职业中,公交车司机、飞行员和船长并不能摆脱阿尔茨海默病的威胁。研究者怀疑,这是因为他们往往只会开固定的路线,很少需要大脑主动导航,因此也起不到“锻炼”海马体的目的。


当然,作者也提醒,这项研究并不能就因果关系得出明确结论。如果想要明确空间认知工作是否会影响阿尔茨海默病的死亡风险,还需要更进一步的研究。



迪士尼公主的健康风险


尽管迪士尼经典电影中的公主们,最终总是“从此过着幸福快乐的生活”(living happily ever after)。但医学专家却出,迪斯尼公主们的生活方式或许面临着严重的健康危害


白雪公主和《阿拉丁》中的茉莉公主从小缺乏社交机会,这可能导致们面临由于孤独引起的抑郁、焦虑甚至心血管疾病和早逝的风险。此外,茉莉公主长期与老虎拉贾近距离接触,也增加了她患人畜共患病的风险。同理,《美女与野兽》中,贝尔与野兽的密切接触也可能让她接触到许多可能危及生命的传染病,例如狂犬病和布鲁氏菌病。


灰姑娘的日常劳作让她总是暴露在灰尘中,使她面临肺病风险,仙女教母散播的大量神奇散粉——也就是涂铝微塑料——可以穿过人体肺部组织,可能会让她肺病更加严重。《风中奇缘》中,宝嘉康蒂达悬崖跳水令人印象深刻,但作者警告说,她下落时间长达9秒,估计悬崖高度约为252米,这样的骨折风险十分巨大。


《睡美人》中,公主奥罗拉无休止的睡眠会给她带来心血管疾病、中风、肥胖和糖尿病的风险,而长期卧床则会增加压疮和肌肉萎缩的风险。而长发公主的毛囊可能因为头发被反复过度拉扯而严重受损,引发牵拉性秃发(traction alopecia),症状为头皮疼痛和永久性脱发等。


作者总结道:“迪斯尼必须考虑采取干预措施来克服这些健康挑战,包括正念与心理治疗、接触野生动物的培训以及针对传染源和有毒颗粒的个人防护措施。只有这样,迪士尼公主们才能从此过幸福健康的生活。”


论文链接:

https://www.bmj.com/content/387/bmj-2024-081948

https://www.bmj.com/content/387/bmj.q2417

https://www.bmj.com/content/387/bmj-2024-081814

https://www.eurekalert.org/news-releases/1068362

https://www.bmj.com/content/387/bmj.q2548.full

https://www.eurekalert.org/news-releases/1068363

https://www.bmj.com/content/387/bmj-2024-082194


-电商广告-
《环球科学》试读包正在热卖

《环球科学》2025年度征订现已开启