2024年10月,诺贝尔化学奖授予了David Baker、Demis Hassabis和John Jumper,以表彰他们在蛋白质结构预测和设计领域的开创性贡献。而在这个领域中,动脉网关注到一家名为Cradle(Cradle Bio B.V.)的新兴生物技术公司,以其创造性的AI蛋白质设计平台,在生物技术行业中崭露头角,成功突围。
Cradle成立于2021年,是一家专注于利用人工智能技术进行蛋白质设计的生物技术公司。公司的目标是通过AI技术简化蛋白质设计过程,提高研发效率,降低成本,并加速新药和新材料的开发。
Cradle在2022年获得由 Index Ventures 和 Kindred Capital 领投,Feike Sijbesma 和 Emily Leproust 参投的550万美元种子轮融资。
2024年11月,Cradle完成了7300万美元的B轮融资,由IVP领投,现有投资者Index Ventures和Kindred Capital跟投。至此,Cradle的总融资额已超过1亿美元。
Cradle融资历程 图源:动脉网制图
01
七年Google 工程师,投身蛋白质AI领域
Cradle的联合创始人兼首席执行官Stef Van Grieken在成立Cradle之前,曾在谷歌(Google)工作了七年,担任高级产品经理,参与了包括Google AI(Google Brain)和Google X在内的多个项目。期间,他还曾担任欧洲议会政策顾问、Startupbootcamp常驻创始人和Open State Foundation 的董事会主席。
Stef van Grieken在Google的工作经历让他深刻认识到人工智能的强大潜力,尤其是在生物技术领域。他意识到,虽然我们在人工智能世界中处于 ChatGPT 4.0,但我们在理解和操纵生命语言的能力方面是生物学 0.5。
2021年,Stef辞去Google 的工作,与Jelle Prins共同创立了Cradle。Stef和Jelle曾都是Google的员工。在成立Cradle后,Jelle Prins起初负责产品设计团队,但随着公司的发展,他主要关注于在市场上定位品牌,即如何让人们思考Cradle,以及什么能够引起共鸣。Stef van Grieken作为公司的首席执行官兼联合创始人,他主要负责公司的战略方向和运营管理。他们两人共同创立Cradle,希望利用人工智能加速生物学家设计蛋白质和调整酶的过程,促进药物的加速开发。
Stef Van Grieken 图源:University of groningen
Stef Van Grieken的灵感来源于将AI应用于DNA序列研发,以降低成本并提高研发效率。他曾想象:“凭着一己之力将知识生产的边际成本降为零,AI已经在音频视频文字领域展现了巨大的潜力,如果我们把LLM(大型语言模型)用于DNA序列研发,并将研发成本降低60%呢?”
Stef van Grieken希望通过Cradle的技术平台,让科学家能够更快、更高效地设计和优化蛋白质,从而加速新药、可持续材料和无动物食品的开发。他相信,通过AI驱动的蛋白质工程,可以比传统方法更便宜、更快地发现新的治疗方法和材料。
02
提高1.2-12倍研发速度,成本降低90%
蛋白质工程面临的挑战显而易见,通过传统方法开发新的蛋白质产品不仅耗时、成本高昂且容易出错。科学家们经常花费数年时间进行实验,使用数百万美元的资源,但无法保证成功。
为此,Cradle 希望创建一种类似于“生物学家的 Photoshop”的平台,让生物学家们能够运用机器学习模型,像利用Photoshop处理图像一样轻松地设计和优化蛋白质。
为了实现这一目标,Cradle首先建立了自己的湿实验室,生成了数十亿的蛋白质序列和实验室数据。然后,利用这些数据来训练其专有的生成式人工智能模型。该模型依托于云计算的AI平台,用于设计DNA蛋白质序列,以便于生物学家能够更加轻松地进行蛋白质设计和优化工作。
具体而言,该云计算AI平台能够通过深度学习算法预测蛋白质的三维结构,并设计具有特定功能的新型蛋白质,可被应用到新药开发、可持续化学品的合成、农作物保护等领域。
蛋白质AI生成界面 图源:Cradle官网
作为一款目标向任何人都能使用的AI蛋白质设计产品,Cradle 的技术能以更少、更成功的实验大幅加快蛋白质的设计和优化。据Cradle官网,与行业基准相比,大多数项目使用 Cradle 平台的进度快两倍,使用Cradle的公司研发项目速度显著加快,提高了1.2 到12倍,成本降低了高达 90%。
为此,Cradle设计了一个与现有蛋白质生成和设计工作流程相匹配的系统,覆盖从目标设定到最终产品交付的整个过程。该系统从目标分析和设定开始,经过蛋白质序列生成、实验室测试,最后将实验室结果导入系统。Cradle的操作界面经过精心设计,旨在尽可能简化用户体验,使其易于上手,更契合用户现有的工作流程。
用户在使用Cradle平台时,仅需提供他们计划测量的数据参数以及期望的结果。一旦蛋白质序列生成,紧接着在湿实验室便会进行相应的测试。在每一轮实验结束后,用户的实验数据将被反馈回Cradle系统。这个过程不仅有助于优化用户的私有Cradle模型,还能让用户对接下来的实验轮次有更准确的性能预期。
Cradle操作流程 图源:Cradle官网
此外,Cradle还提供一系列功能,以便利用户进行蛋白质设计。其中包括:
智能蛋白质序列优化:Cradle分析现有蛋白质序列,提出改进方案,并预测优化后的性能。与其他数据科学软件通过依赖专家知识、复杂实验数据或蛋白质结构信息的方式不同,Cradle通过AI提供设计建议,为生物学家带来蛋白质设计优化的深刻见解和建议。
结构预测:Cradle能够基于序列预测蛋白质的三维结构,并可视化展示。与I-TASSER(蛋白质结构预测和基于结构的功能注释的分层方法)相比,后者需要多次碎片组装模拟才能构建三维结构,Cradle的处理速度更快。
功能预测:Cradle评估设计蛋白质的潜在功能,并预测其与其他分子的相互作用。这类似于微软研究院开发的μProtein框架,两者都具备强大的蛋白质序列优化能力。
数据库集成:Cradle接入大型蛋白质数据库,实现快速检索相关信息。与DTiQ(全球领先的智能视频监控和损失预防解决方案提供商)等平台类似,它们提供实时KPI跟踪和自定义报告功能,帮助用户监控关键绩效指标。
协作平台:Cradle支持团队成员共享设计方案、讨论、版本控制和项目管理。与其他在线协作平台提供的项目管理和团队协作功能相似,旨在提升团队效率。
与传统方法不同,Cradle能在单个回合中处理多个属性和优化任务。包括酶、疫苗、肽和抗体。
Cradle使用界面 图源:Cradle官网
而在数据安全和保护方面,Cradle平台则采用业界领先的银行级安全措施来保护用户数据,确保只有用户本人及其授权的人员能够访问相关的蛋白质序列和实验数据。该公司承诺,用户的数据不会被用于训练其他用户的模型,从而保障了用户数据的隐私性和专属性。同时,Cradle还采用软件即服务(SaaS)的商业模式,这种模式简化了商业交易流程,避免了复杂的版税、收入分成和知识产权等潜在问题,为用户提供了一个清晰、高效的合作环境。
03
牵手MNC,正在开发31种蛋白质
Cradle 推出的AI蛋白质设计平台,给生物制药公司带来了新机遇。让它们有望打破新药研发领域长久以来的“双十定律”——即新药研发需要超过10年时间和10亿美元的投入。
利用AI,Cradle帮助科学家不仅能够从成功的案例中汲取经验,还能从失败的实验中挖掘出有价值的信息,发现新的可能性。这带来了更好的药物、更可持续的材料和无动物成分的食品的前景——所有这些都比传统方法更便宜、更快捷地被发现。
在2021年成立之初,美国强生公司便与Cradle签订了合作协议,并成功利用Cradle的模型修缮蛋白质,提高了其效能。随后,在最近一年内,Cradle进一步扩大了合作伙伴网络,与MCN诺和诺德以及合成生物学领域的领先企业Ginkgo Bioworks签署了新的伙伴关系,将客户群扩展至制药、化工、食品、农业和材料等多个行业。
自从今年年初将软件平台投入商业化运营以来,Cradle的客户群已超过21个,并且正在开发31种蛋白质项目。
在今年由Align to Innovate(一个非盈利的开放科学国际组织)举办的蛋白质工程锦标赛中,来自工业界和学术界的30多个团队参与了对酶工程中最新计算方法的基准测试。在四个监督酶特性预测挑战中,Cradle自动生成的模型,两次第一名,两次并列第一名。
“Align to Innovate”基准的酶优化挑战 图源:Cradle官网
此外,Cradle 最近还招募 Sam Partovi 加入公司担任首席商务官,Sam 在为生命科学行业扩展基于云的平台方面拥有超过 20 年的经验,曾在 Medidata(全球领先的临床数据和分析平台提供商)、Benchling(全球领先的大分子研发云实验室信息学平台) 和 VeevaSystems(生命科学行业云软件的全球领导者) 组建上市团队。目前,该公司团队有 43 名成员。
近
期
推
荐