快速导读:被视为学术界基础设施的论文预印本网站arXiv宣布从康奈尔大学独立,并招聘CEO。这一举动,连同其高达600万美元的年预算,引发了社区的激烈争论和普遍恐慌。有人算了一笔账,发现其服务器成本可能低得惊人,这让人们开始警惕:这是否是“变质”的第一步,尤其是在AI公司垂涎其海量数据的情况下。
该图片可能由AI生成
一份招聘启事正在科技圈悄悄流传:arXiv首席执行官(CEO),预计年薪30万美元。对,就是那个托管了几乎所有AI、物理和数学领域重要论文的网站,那个界面好像20年没变过的arXiv。
对大多数研究者和AI工程师来说,arXiv就像互联网的水电煤,一个理所当然的、几乎感觉不到其存在的公共设施。你以为它会永远这样朴素、免费、可靠地运行下去。但现在,它宣布将从康奈尔大学独立,成立一个独立的非营利组织,年预算高达600万美元。
真正的风暴来自一条评论。有程序员做了个简单的估算:arXiv托管了大约9TB数据,每月下载量约41TB。即使不算缓存优化,在廉价的云服务上,每月的硬件成本可能不到1000美元。这一下点燃了所有人的困惑:那另外的599万美元,到底花在了哪里?
官方给出的解释是人力成本,他们的薪酬支出是350万美元。但这个解释并没有平息人们的焦虑。更深层的恐惧不是预算本身,而是这个举动背后的信号。一个被用户调侃“界面停留在2000年”的网站,突然要设立一个“CEO”职位,这本身就充满了现代企业运作的色彩,而这恰恰是arXiv过去极力避免的。
在AI的淘金热中,这个动作显得尤其扎眼。人们开始用一个词来形容自己的担忧:Enshittification(劣化)。这是否是商业化的第一步?下一步会不会是为了覆盖高昂的运营成本,而向那些急于获取训练数据的AI公司出售API,或者更糟,开始在网站上放广告,甚至对论文提交或阅读收费?
这不是什么遥远的学术圈八卦。如果你是一名研究员,这意味着你赖以为生的“数字图书馆”正在变成一个有KPI的“公司”。如果你是AI从业者,那座免费、开放的训练数据金山,可能很快就要挂上“付费进入”的牌子。
ArXiv当初的诞生,正是为了打破Elsevier等传统学术出版商构筑的付费高墙。现在,所有人都在屏息凝神地看着,想知道这个曾经的屠龙勇士,会不会最终长出自己的鳞片。
---
简评:
基础设施的悖论就在于此:你只有在它坏掉,或者开始给你寄账单的时候,才会意识到它的存在。arXiv的这次“升级”,让所有享受了它三十年免费午餐的人,第一次开始计算午餐的价格。而最令人不安的是,没人知道菜单什么时候会递过来。
---
ref: reddit.com/r/math/comments/1rtimpu/the_arxiv_is_separating_from_cornell_university