多个热门AI在医学测试中表现出轻度痴呆迹象 ; 曾被学生联合举报的教授又被多份刊物撤稿 | 学界速递

海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
图片

 速  览 


  1. 多个热门AI在医学测试中表现出轻度痴呆迹象

  2. 曾被学生联合举报的教授又被多份刊物撤稿

  3. 与自闭症有关的24个字母

  4. 月球年龄有了新估计,45.1亿年史上最老

  5. 我国上山遗址发现距今一万年的稻米酒






学界动态



1. 多个热门AI在医学测试中表现出轻度痴呆迹象


《英国医学杂志》圣诞刊经常发布一些严肃但是结论搞笑的研究论文,今年也不例外。以色列哈达萨医疗中心(Hadassah Medical Center)的科学家使用蒙特利尔认知评估(MoCA),对5种主流LLM进行了测试,包括ChatGPT4、ChatGPT4o、Claude3.5“Sonnet”、Gemini1.0和Gemini1.5。


蒙特利尔认知评估是一种常用于给老年人检测认知障碍和早期痴呆迹象的测试,通过30道简单的问题,只需10分钟就能评估受试者的注意力、记忆力、语言、视觉空间技能和执行功能等能力。最高分为 30 分,26 分或以上通常被视为正常,26分以下被视为存在一定程度的认知障碍。


结果显示,只有ChatGPT4o拿到了26分,勉强算个正常人。而ChatGPT4、Claude和Gemini1.5的得分均落在了轻度认知障碍范围内,Gemini1.0甚至直接被划入中度认知障碍之列。


图片

图源:BMJ 2024

doi.org/10.1136/bmj-2024-081948 


LLM主要是在视觉空间技能和执行任务方面表现不佳,例如连线任务(按升序连接圈出的数字和字母)和时钟绘制测试(绘制显示特定时间的钟面)。对于那些用语言描述,语言作答的题目则表现不错。作者认为LLM无法表现出同理心或准确解释复杂的视觉场景,体现了人类大脑和大型语言模型之间的本质区别。值得一提的是,更老版本的LLM的表现更差,从侧面证明这些AI确实是有进步的。


图片

题目:画出11:10分的时钟,A是一般人类的答案,其他则是AI们的清奇脑回路


参考来源:

https://www.bmj.com/content/387/bmj-2024-081948



2. 曾被学生联合举报的教授又被多份刊物撤稿


曾遭11名学生联合举报的华中农业大学原教授黄飞若,近期遭多家国际级刊物撤稿。截至12月10日,黄飞若团队被撤的期刊文章至少有4篇,时间涵盖2017年-2022年,包括International journal of cardiology 、 Journal of animal science and biotechnology 、Journal of Hepatology、Animal Nutrition 等刊物陆续撤下了该团队发表的论文。


黄飞若原为华中农业大学动物科学技术学院教授,今年1月遭到学生联名举报。当时,华中农大11名学生联合举报其存在篡改数据、编造实验结果等学术不端行为,引发广泛关注。据媒体报道,举报材料长达125页,列举了黄飞若指示学生在科研实验中进行数据篡改、重复使用、编造数据以及操纵同行评审、克扣学生劳务费、打压学生、论文不当署名、教材编写造假等行径。今年10月,国家自然科学基金委员会监督委员会将与黄飞若有关的案例列入了新一批科研不端行为案件处理名单中,给予了不同程度的处罚。


参考来源:澎湃新闻

https://news.qq.com/rain/a/20241223A04TZS00




前沿研究



3. 帕克探测器将创造接近太阳新纪录:610万公里


图片

图源:NASA/约翰霍普金斯 APL/Steve Gribben


本周二,NASA的太阳探测器 Parker 将以前所未有的近距离掠过了太阳表面,飞入太阳的外层大气即日冕中,距离太阳表面610万公里,在这期间探测器将与地球失联,结果需要2天后才能揭晓。


帕克太阳探测器的设计目标是近距离观察太阳,追踪能量流动,研究日冕的加热情况等。科学家希望它能回答一直以来令人困惑的问题:为什么日冕比太阳表面热得多?太阳风是如何加速的?高能太阳粒子的来源是什么?自 2018 年发射以来,该探测器一直在逐渐靠近太阳运行,并利用飞越金星的引力将其拉入更内部的太阳轨道。多次近距离观察时,Parker 都经受住了1000度以上的高温考验。


参考来源:

https://www.reuters.com/technology/space/nasa-spacecraft-attempts-closest-ever-approach-sun-2024-12-24/



4. “外星植物”比想象中更奇怪


图片

源:佛罗里达自然历史博物馆\Jeff Gage


1969年,在美国犹他州的曾发现一组植物化石,被命名为Othniophyton elongatum,意思是“外星植物”。当时它被归入了人参科,而新的研究认为,它不是人参,却比人参还要奇怪。


通过最新的技术,科学家们发现这种植物具有独特的特征,包括在结实果实时仍保留着雄蕊,这在现代植物中是从未见过的。尽管他们对这种植物进行了详细的分析,但仍然无法将其归入已知的植物科或属,这表明这种植物可能已经灭绝,也可能与其近亲一起消失。这件事提醒科学家,对于未知一定要谨慎处理而不是将它们与已知的事物硬拉上关系。该研究发表在《植物学年鉴》杂志上。

参考来源:
https://academic.oup.com/aob/advance-article/doi/10.1093/aob/mcae196/7888709#498619978


5. 嫦娥六号月壤样品揭示首个月球背面古磁场信息

图片

嫦娥六号玄武岩样品磁场记录揭示28亿年前存在相对活跃的月球磁场发电机


12月20日,中国科学院专家利用嫦娥六号采回的月球背面样品做出的又一项创新成果刊登在Nature上。


中国科学院院士、地质与地球物理研究所研究员朱日祥和副研究员蔡书慧等,联合国家天文台研究团队,对获批的4颗毫米级玄武岩(记录样品冷却过程中的磁场信息,是研究古磁场强度的理想材料)岩屑样品开展了磁学研究。结果显示样品记录的古磁场强度为~5-21 μT(中值~13 μT)。与此前研究认为的月球发电机强度在31亿年前急剧下降之后可能一直处于低能量状态不同,嫦娥六号玄武岩样品的古磁场强度结果揭示月球磁场可能在28亿年前发生反弹,指示月球发电机在早期急剧下降后可能重新激活。其原因可能是发电机主要能量来源发生变化或初始驱动机制再次增强。对比不同发电机模型模拟结果,嫦娥六号玄武岩记录的古磁场强度与基底岩浆洋模型产生的场强最为一致,但不能排除进动发电机的贡献,同时其他机制如内核结晶可能为月球发电机提供补充能量。


参考来源:

https://www.nature.com/articles/s41586-024-08526-2




点击下方知社人才广场,查看最新学术招聘