学术打假风,这次吹到了苏州市第九人民医院...
一篇由 Ying Xiao(Suzhou Ninth People’s Hospital) 等人于2026年发表在《BMC Musculoskeletal Disorders》期刊上的系统评价文章引发了质疑。该文章题为《From general to precision rehabilitation: a systematic review of VMO-Targeted versus general quadriceps strengthening in patellofemoral dysplasia》,试图在临床康复领域提出指导性建议。
然而,来自圣保罗联邦大学的学者 Lucas Simões Arrebola 和 Carlos Eduardo Pinfildi 联名发表了详尽的同行评议意见,毫不留情地揭露了该文章在方法学、数据提取和文献解读上存在的严重缺陷。有意思的是,Arrebola 正是被 Ying Xiao 等人的系统评价所引用的 “Arrebola 等人 (2024)”这篇原始研究的作者。
在文献筛选与纳排标准方面,这篇综述展现出了不严谨,背离了其预先设定的研究基准。作者在文中明确声明,只有涉及影像学确诊为髌股关节发育不良患者的随机对照试验(RCT)或前瞻性队列研究才具备入组资格。但在实际操作中,他们却纳入了大量明显违背这一标准的文献。例如,Rabelo(2017)、Hansen(2023)以及 Khayambashi(2012)等人的研究对象实际上是髌股关节疼痛综合征患者,Khayambashi 的研究甚至将髌骨脱位明确列为了排除标准。
该综述还将临床实践指南(Willy 等,2019)、正式共识文件(Blønd 等,2025)甚至其他系统评价和荟萃分析(Rathleff 等,2014)作为原始数据研究纳入其中。被纳入的 Powers 等人(2003)的研究缺乏随访期、未应用影像学诊断标准、患者表现为半脱位而非全脱位,而且其本质是一项观察性运动学研究,并非符合要求的临床试验。这种筛选过程中的随意性严重破坏了研究的内部一致性和可重复性。
除了文献筛选的混乱,该综述在数据提取和报告环节更是暴露出大量涉嫌捏造与篡改的低级错误。
在报告原研究特征时,研究样本量、随访时间和诊断标准被随意篡改。以 Arrebola 等人(2024)的研究为例,原试验实际招募了40名受试者并进行了为期12个月的随访,且在原论文中明确承认未使用影像学诊断标准;但这篇综述却将其歪曲为85名受试者、8周随访,甚至在综合表格中凭空捏造该研究使用了 Dejour 分型和 TT-TG 距离。类似的数据失真还出现在对 Khayambashi(实际28人被报为60人)和 Hansen(实际200人被报为72人)研究的引用中。
作者甚至将 Powers 等人的观察性研究错误归类为随机对照试验,并生硬地将股内侧肌与股外侧肌的肌电图比例(VMO:VL ratio)及髌骨轨迹测量等结果强加于根本未曾评估过这些指标的 Rabelo 和 Smith 的研究之上。
在对原始研究结论的解读以及参考文献的追溯性上,这篇系统评价同样存在指鹿为马的行为。原作者 Arrebola 明确指出,他2024年发表的试验在48周的随访中并未发现干预措施之间存在任何具有统计学意义的差异,但这篇综述却声称该试验“证明了髋关节与股四头肌联合强化优于单纯膝关节强化”。
由于这一假声明构成了该综述核心主张的基础,其误导性很严重。在参考文献的准确性方面,文章中甚至出现了文章标题、作者与 DOI 标识符完全不匹配的现象。
例如,一个被归属于“Dan M 等人”的 DOI 链接,实际指向的是一篇完全不同的体外生物力学研究。综述作者错误描述了该文献的作者和标题,还凭空捏造结论,利用这篇体外研究来支持“深度屈曲运动会使发育不良的滑车关节接触压力增加200-300%,从而加速软骨退化”这一重大临床主张,而原出版物中根本不存在此类结论。
这篇综述所暴露出的问题反映了其在文献选择、数据提取和证据解读全链条上的系统性崩塌。考虑到该文章提出了“常规股四头肌训练会使髌骨不稳定的风险增加2.1至4.5倍”这样极具临床影响力且强烈的结论,其底层证据的虚假与混乱无疑严重损害了证据合成的内部效度与可靠性。
正如批评者所呼吁的那样,为确保科学研究的严谨性与公信力,必须对该研究的入选资格进行详细的重新评估、核实提取的数据,并仔细校对所引证据与最终结论之间的一致性,以肃清学术环境,避免错误的医学结论误导临床实践。