星空传来的信号是什么样子?
是一片更密集的“星空”。
这是中国天眼FAST从宇宙接收到的原始信号图,横轴代表时间,纵轴代表不同频率的信号。几乎每秒发出一次信号的“J人”脉冲星,就藏在这一片绿色的“星空”里。
FAST的工作之一,就是找出这些脉冲星,帮助人类在未来的星际航行中确定自己的方位。
截至2024年11月,FAST发现脉冲星数量已突破1000颗,超过同一时期国际其它望远镜发现脉冲星数量的总和。自2021年腾讯与国家天文台、复旦大学联合启动“探星计划”开始,在腾讯云+AI技术的辅助下找到了51颗脉冲星,而其中有28颗,是在最近一年内使用业界最新的算法模型找到的。
相较2021年前的搜寻方式,目前的速度提升了数百倍。
这是怎么做到的?
//让AI“自学”成为天文学家
疑似脉冲星的信号图FAST一周就能产生3000多万张,如果靠人工处理,即使24小时工作,也需要一年多时间才能把这些图像处理完。在早期,即便使用天文领域的专业软件,1TB的数据也需要处理十几天。
如何让AI成为又快又准的“天文学家”,是腾讯最初的目标。
在合作早期,这个领域尚且没有大量标注数据,相当于没有“教材”。为了让AI模型能够尽快“毕业”,项目团队设计了一种基于多模态+半监督学习的AI解决方案:让AI不断深度“自学”天文知识,在收到原始信号后,无需人工标注,AI先用天文知识进行预判和筛选,在大规模数据中自动建构有效信息,最后再进行人工对比。
如此一来,FAST数据的处理速度提升了120倍以上。过去人工处理需要一年的工作,AI不到3天就能完成,误报率也下降了98%。
//AI新模型:不懂天文,速度更快?
过去的一年多,腾讯在AI模型上完成了自我革命式的迭代——不需要懂天文,也能找到脉冲星。
腾讯优图实验室设计的端到端算法模型FastSearch,完全抛弃了过去对原始信号需要进行的过滤噪声、傅立叶变换等天文学专业处理和复杂标注,相当于没有“中间商”,节省了大量的算力和时间。
如果说过去的数据处理是一道弯弯曲曲的盘山路,那么新的AI模型就是从山脚下笔直通向山顶。
这条“捷径”,让信号处理效率较合作初期的AI模型提升15倍,较2021年以前的处理方式提升了数百倍。甚至天眼捕获宇宙信号的速度,已经跟不上AI“看图”的速度。
//多示例学习+大模型辅助训练:不仅更快,还要更准
有了速度,还要有精度。
2024年以来,腾讯把视觉大模型当作早期辅助训练的“老师”,引导小模型进行初步的知识学习。为了提升模型判别的精度,在搜索模型中新采用了“多示例学习”。
经过学习的模型会把图片切分成多个示例,然后分开进行“打分”,综合判断其中是否有有用的信号。
除了脉冲星,鹅的AI模型还辅助发现了3例快速射电暴,快速射电暴在几毫秒时间内释放的能量,相当于全世界几百亿年发电量总和。这是目前天文领域研究的热点。
我们不仅是在接收来自宇宙的信号,也在把最先进的人类技术与文明发送到遥远的星空。
最后,互动一下:“探星计划”启动后的两年内,共合作发现了多少颗脉冲星?
评论区抽正确答案前3名,送限量版蛇年企鹅公仔!