人工智能怎样帮科学家保护鸟类

图片这种羽毛鲜艳的蓝点颏是阿拉斯加鸟类爱好者的最爱,那里也是它们繁殖的地方。图源:KRISTAPS SOKOLOVSKIS, NAT GEO IMAGE COLLECTION
撰文:Kiley Price
每年春天,在美国西部,科学家们都会在内华达山脉(Sierra Nevada)蓊郁的森林里藏下1600多个饭盒大小的录音机。
夏末,当这些机器被回收时,里面已经录下百万小时的音频,经常就包含西点林鸮发出的呼呼声、犬吠般的嚎叫声和哨音。——这些都是有价值的信息,它们记录了这种濒危鸟类在哪里生活。但要指望人类筛选,音频量就太大了。
图片一只西点林鸮栖息在一棵北美翠柏上,这里属于加州塔霍湖国家森林中一片老龄林区域。图源:JENNY E. ROSS/NATURE PICTURE LIBRARY
“我们无法把它们听完,一点可能也没有,是吧?”康纳•伍德(Connor Wood)说。伍德在丽莎•杨保护生物声学中心(K. Lisa Yang Center for Conservation Bioacoustics)担任研究助理,是猫头鹰项目的共同领导人。该中心是康奈尔鸟类学实验室(Cornell Lab of Ornithology)的一部分,位于纽约伊萨卡小镇(Ithaca)。
结果看来,这支团队实际上能够处理如此海量的数据——他们只需要来自“鸟联网”(BirdNET)的一点小小的帮助。BirdNET是一个发布于2019年的人工智能系统,仅凭鸟类的鸣叫,它就能分辨全球6000多种鸟类。
伍德所在实验室与德国开姆尼茨工业大学(Chemnitz University of Technology)合作开发了BirdNET应用程序,他说:“我们需要真正灵活的工具,尽可能多地识别可发声动物。在生物声学领域,BirdNET的变革性真的很难用语言形容。”
图片大群红翅黑鹂在加利福尼亚克拉马斯盆地国家野生动物保护区(Klamath Basin National Wildlife Refuge)上空飞过。图源:FRANS LANTING, NAT GEO IMAGE COLLECTION
过去十年,许多应用程序涌现出来,开始挖掘人工智能识别不同鸟类声音的潜力,科学家与鸟类爱好者们都爱不释手。
这些工具也存在缺陷:比如有时会认错品种。但更多的研究显示,人工智能技术可以识别鸟类的行为与分布,这对保护工作非常重要。
工作原理
2016年,康奈尔鸟类实验室联系到开姆尼茨工业大学的计算机科学家斯蒂芬•卡尔(Stefan Kahl),在卡尔的帮助下开发了处理野外鸟类录音的算法。
2年后,团队发布了正式的BirdNET应用程序,这款app允许全世界用户上传笔记本电脑和智能手机等各种设备采集的录音。自那时起,BirdNET已经积累了约莫1.5亿条高质量的鸟类录音。
图片BirdNET应用程序(如图,一位纽约伊萨卡的用户正在使用它)可以凭借鸟的发音辨别3000种鸟类。图源:STEFAN KAHL, K. LISA YANG CENTER FOR CONSERVATION BIOACOUSTICS, THE CORNELL LAB
康奈尔另一款人工智能鸟类声学应用“灰背隼”(Merlin)有300多万活跃用户,人们将鸟类声学数据添加到系统中,进一步丰富了这个宝库。但这些仿如魔法般的应用到底是怎么工作的呢?
首先,程序会把鸟的声音转化为声波的图像,即声谱图。然后,图像被输入到程序的算法中,算法就会根据具体的鸣叫声准确指出独特的音频变化、时长与振幅。
“算法找到的特征更加细致入微,远超任何人类能达到的水平。”卡尔说。卡尔同时在康奈尔实验室生物声学保护中心担任博士后研究员。
图片在英国威尔士的斯科默岛(Skomer Island)附近,两只海鹦扇动翅膀,大张着嘴,争斗得满身泥泞。图源:DANNY GREEN, NAT GEO IMAGE COLLECTION
在美国林务局和国家公园管理局的资助下,伍德与团队不久前使用BirdNET出具了内华达山脉西点林鸮的首个全生态系统评估。这些鸟儿正在面临入侵物种和野火灾难所带来的越来越多的威胁。伍德说,评估信息展示了这类林鸮的数量变化趋势,可以促进恢复与保护工作。
“政府机构不仅把它当做种群数量的监控工具,同时还依靠它实实在在推进具体行动,这非常鼓舞人心。”伍德说道。
不利的一面
不过,和大部分基于人工智能的科技产品一样,这些应用程序并非毫无缺陷。
生态学家克里斯蒂安•佩雷斯-格拉纳多斯(Cristian Pérez-Granados)2023年在《国际鸟类科学杂志》(International Journal of Avian Science)发表研究,梳理了一系列讨论BirdNET的科学文献。佩雷斯-格拉纳多斯在西班牙阿利坎特大学(University of Alicante)工作。他说,研究显示BirdNET并不总能记录鸟儿的鸣唱,有时还会把一种鸟错认为其他品种,这就会导致误报。
Merlin用户也报道过识别错误的情况,鸟类保护组织奥杜邦学会(Audubon Society)和别的一些组织表示,这可能会对引用公民科学数据的研究项目产生不良影响。
“过去2、3年间,BirdNET和其他一些软件做出了巨大改变,不过还需继续发展和完善。”佩雷斯-格拉纳多斯说。
图片在怀俄明州的大提顿国家公园(Grand Teton National Park,Wyoming),一只白腹鱼狗衔着食物飞过。图源:CHARLIE HAMILTON JAMES, NAT GEO IMAGE COLLECTION
有办法减少这样的风险,如在使用统计模型时考虑不确定性,或人工核对鸟类身份信息以完成对数据的双重检查,这也是伍德西点林鸮项目的现行流程。
直到最终确认以前,“你都得把它提供的信息当做一种预测,”伍德说,“我乐意看到一些类似的分类错误,因为这至少表明,我们建立了鸟类群落数据,这是此前从来没有的。”
事实上,公民科学家的百万雄师正在为Merlin和BirdNET等应用程序贡献大量丰富的数据。在2022年一篇研究中,伍德与团队评估了BirdNET提交结果的准确性,随后发现其数据成功地复现了集中北美洲和欧洲候鸟的迁徙路线。
借一双耳朵
图片黄腰林莺广泛分布于整个北美洲,常常出现在冬季几个月。图源:JIM BRANDENBURG, NAT GEO IMAGE COLLECTION
鸟类声音识别应用让更多的人,特别是听障人士,也有机会接触观鸟活动。
大概5年前,艾琳•罗林斯-普莱奇(Erin Rollins-Pletsch)在某个早晨醒来,发现丧失了差不多80%的听力,这是由一种罕见疾病造成的。起先,她努力摸索身边陌生而且安静得多的世界。后来,她找到了自己的观鸟之路。
“当我身处室外,全心关注鸟类,其余所有事情便都不重要了。”罗林斯-普莱奇说。她住在旧金山东面40分钟车程的地方,是一位教师。
不过,她听不到绝大部分高频哨音、啁啾与啼鸣。当鸟儿从视线里消失,别的观鸟者就借助这些声音追踪它们。这就是她如今在户外携带智能手机并开始使用Merlin的原因。
“当我在外面打理花园或后院我安装的所有鸟类喂食器的时候,我就会按下手机的录音键。”罗林斯-普莱奇说。
“然后,当鸟儿唱起歌来,相应的识别结果就会一个接一个在我的手机上弹出来。(识鸟程序)会把它们的歌声读给我听。我简直无法表达我有多么喜爱它。”
(译者:绿酒)