四十年前的12月,银河-I型巨型计算机横空出世,这个由中国人自主研制的亿次电子计算机系统,打破了国外的技术垄断,使中国成为全世界第三个能独立设计和制造巨型计算机的国家,也由此开启了中国高性能计算辉煌发展历程的序幕。
银河-I型巨型计算机先后生产了三台,一台应用在了国防领域、一台应用在航天领域,还有一台则应用在石油部物探局研究院,服务于石油勘探领域。
高性能计算,是怎么与石油勘探产生缘分的?
事实上,石油行业一直对高性能计算有着极度的渴望。早在60年前,大庆油田开发时期,石油勘探人员为了分析石油的地下分布,仅分析化验多达160万块次,地层对比则超1744万次。
也正是基于此,石油勘探也成了高性能计算设备的“试验场”。而如今,随着中国油气勘探走向“无人区”,从常规转向非常规、从陆上转向海上、从浅海转向深海,石油企业对高性能计算的要求也是越来越苛刻。在更加复杂的地形环境中,如何更快地找到石油、如何更精准地找到石油,成为石油企业和高性能计算服务商所面临的重要问题。
石油勘探能力全球领先的背后
石油勘探,在中国能源开发史上的地位举足轻重。新中国成立后,中国石油工业在一片空白中起步。在资源匮乏、技术落后的年代,石油勘探者们靠着双脚丈量大地,用简陋的地质锤和放大镜,用最原始的工具和方法,开启了对地下宝藏的探寻。
时过境迁,中国石油勘探技术早已位居全球前列,石油勘探方法也不断迭代,进入了高精尖时代。
这背后有一支不可忽略的助推力,即数字电子和计算机科学的飞速发展,让高性能计算在石油勘探领域日益广泛应用,推动了中国石油勘探向自动化、智能化、精细化的高质量跃升。
尤其是本世纪初期,中国石油集团全资子公司东方物探公司(英文名称:BGP)投入巨资研发的国内第一款地震数据处理解释一体化大型软件GeoEast,更是打破了国外技术的垄断。
在全球石油勘探中,地球物理方法仍是最核心、最有效的工程手段,其中,全球95%以上的油气田发现都依赖于“地震勘探”。地震勘探被形象地喻为给大地做“CT”,它通过人工激发地震波,获取地下岩层的影像数据,再进行分析以识别油气层。其主要包括数据采集、处理、解释三大主要环节,而数据处理、解释则是地震勘探的核心。
石油储藏多位于复杂山地、黄土塬及大沙漠地带,不仅构造复杂、储层复杂,而且还要面临非常规油气藏效益开发,这些复杂的地表条件及复杂的勘探对象,也对地震资料处理业务提出了非常苛刻的要求。
据东方物探相关专家介绍,中国石油主流物探软件平台GeoEast 2023,是全球目前技术系列最全、功能模块最多、唯一一套处理解释一体化系统,在“宽方位五维处理解释一体化技术”“多波处理解释一体化技术”方面达到国际领先水平,可满足从陆地到海洋、从纵波到多波、从地面到井中的地震数据处理解释需求,并且具备从时间域到深度域、从项目级到盆地级、从数据处理到油藏描述等全流程一体化服务能力。
针对复杂的地表条件和勘探对象,GeoEast的应用能够将地下情况看的更清楚,但也带来一个副作用——数据量大幅增长。据介绍,其部分单体数据就达到了PB级,在处理过程中还要乘以十,达到十几个PB的数据量,对存储压力很大。
同时,GeoEast作为行业主流处理解释软件,每个版本都会引入更多的物探新技术,这些物探新技术对算力和存储提出了更高要求。
这些问题,既是GeoEast发展的掣肘,也成为了与鲲鹏高性能计算合作的契机。
复杂工作场景需要工业软件“伙伴”
GeoEast作为典型的工业软件,能实现“百万次”电子计算机运行,这个软件包括平台、处理系统、解释三大系统。
其中,GeoEast-iEco平台是物探软件的平台软件,突破PB级海量数据管理、大规模并行、云计算等关键技术,实现2000节点以上大规模异构集群集中管理,具有全信创全系列软硬件知识产权支持、多学科协同、云模式共享、多层次开放等特点,在海量数据高效管理、大规模并行计算等方面处于国际领先水平;处理系统包括7大软件包、18大技术系列、400多个功能模块,具备陆地、过渡带、海洋等各种地表地质条件地震资料处理能力;解释模块包括5大软件包、21大技术系列,具备勘探开发一体化、地震地质工程一体化能力。
换句话说,能力强的软件平台也意味着规模大、体系繁杂,源代码超过3000万行,远远超过以代码多著称的气象软件,是国内最大、最复杂工业软件。也正由于其高复杂性,所以对存储和算力有着比常规软件更高的要求。
为了从根本上提升计算能力,GeoEast最终牵手鲲鹏作为“合作伙伴”。鲲鹏在存储、算力及网络三大方面的优势赢得了GeoEast的青睐。
在存储方面,鲲鹏采用对称分布式架构,并通过集群模式、自动负载均衡、全局缓存等技术处理和管理系统资源,既能缩短地震资料处理的作业周期,也比较容易实现节点扩容和系统性能和容量的线性扩展。
在高性能计算方面,鲲鹏的计算节点和管理节点采用鲲鹏服务器。尤其对于浮点计算,该服务器优势明显,极大地缓解了地震资料处理中巨大的计算压力。
在网络方面,鲲鹏采用计算、存储和管理三大网络分离的方式,其中,计算网络采用万兆以太网,管理网络采用千兆以太网,存储网络采用10GE以太网或40GE IB网络,以保证数据传输的快捷。
不过,值得注意的是,这一合作首先意味着要实现平台迁移。而完成GeoEast处理系统在鲲鹏平台的适配,是一个巨大的工程级项目。由于GeoEast代码复杂,软件精度要求高,给工作带来巨大挑战。
2023年10月,双方正式开启了适配工作,到如今不到一年时间,已经完成了系统的改造优化。在如此短的时间内完成这样复杂的工程,一方面得益于双方团队的默契配合,一方面得益于鲲鹏一系列方便的迁移适配工具。
为了保证适配顺利实施,双方组织技术人员对GeoEast系统鲲鹏适配进行了技术评估,决定先期适配平台和处理系统,并制定详细的适配计划。
据介绍,基于毕昇编译器,双方团队在40天的时间里,就完成了2000万行代码的梳理编译,同时修改了GeoEast软件中的兼容性问题。据介绍,经过代码优化后,GeoEast实现了鲲鹏版本和X86版本混合部署,两个版本不仅能够实现数据共享,而且能够保持计算的一致性。
引入鲲鹏后,GeoEast在性能方面得到了很大的提升。测试员曾就时间偏移(PSTM)和深度偏移(PSDM)两大性能偏移任务进行了测试。结果显示,相同场景下,鲲鹏比同类处理器能够提升2—3倍。
除此之外,适配鲲鹏后的GeoEast在开发效率、执行多线程计算任务速度方面,也有显著提升。
保障国家能源安全“压舱石”
随着国家能源结构调整的进程,由于石油等传统能源在能源安全方面扮演者“压舱石”作用,石油增储的重要性继续凸显。今年7月,在“大力提升油气勘探开发力度七年行动计划”(以下简称“七年行动计划”)明年到期之际,国家能源局组织召开“大力提升油气勘探开发力度工作推进会”。推进会强调,各石油企业要落实增储上产主体责任,发挥保障国家能源安全“压舱石”的作用。
“七年行动计划”始于2019年5月。彼时,国内油气需求快速增长,但石油产量却连续3年下降,油气进口增速较快,对外依存度持续升高。因此,能源局提出了“石油企业要落实增储上产主体责任,完成2019-2025七年行动方案”工作要求。
石油增储,勘探先行。此后,包括中国石油在内的国内石油企业纷纷调整部署,加大油气勘探力度。作为国内石油勘探领域的重要软件,GeoEast已经在中石化、中海油、煤田、地调、地矿、科研院所等70多家单位实现应用,国内市场占比80%,在保障国家能源安全的道路上,发挥了重大的作用。
“七年行动计划”提出后,国内石油龙头们开始走出“舒适圈”,加快了油气勘探开发向深水、深层及非常规领域进军的步伐,走向了是石油勘探的“无人区”。
一边是愈加复杂而未知的资源条件,一边是为适应波动的油价而带来的降本增效要求,如何缩短勘探时间以及提高井位的准确度则成为了关键问题。
日前举行的工作推进会提出,“加快突破万米级深地、千米级深水、纳米级非常规和老油气田高效开发关键理论与技术难题”,这意味着,已经顺利完成适配的GeoEast和鲲鹏,又有了新的挑战和合作空间。
针对下一步的合作计划,东方物探表示,重点将放在提高异构计算技术和CPU技术两大方向。
据介绍,在异构计算技术方面,虽然其在GeoEast软件中的深度域成像、FWI、多维去噪中得到了成功应用,极大提高了数据处理效率,但是也存在软件开发难度大、代码维护困难、计算平台依赖等缺点;在CPU技术方面,如何利用众核技术来提高软件开发效率和运行效率则是下一步软件开发的重点关注方向。
值得一提的是,在当前多样算力时代,为了帮助合作伙伴持续开发鲲鹏应用,更加便捷、高效的迭代多平台版本,鲲鹏启动了攀峰行动——鲲鹏原生开发计划。鲲鹏原生应用开发旨在为伙伴提供鲲鹏硬件底座、openEuler开源操作系统、鲲鹏开发套件DevKit、鲲鹏应用使能套件BoostKit,实现1套代码+1条流水线,构建多个平台版本。
据介绍,鲲鹏用户可以在流水线中直接使用鲲鹏开发套件DevKit进行代码开发和优化,在提升开发效率的同时确保代码最佳适配鲲鹏;此外,通过鲲鹏应用使能套件BoostKit场景化加速套件,以及欧拉与鲲鹏的协同优化,实现应用性能的大幅提升。
目前,GeoEast业已启动鲲鹏原生开发,高性能计算也将得到高持续强化,不仅使得数据处理和解释时间得以大大缩短,也大大地提高了石油勘探的精确度,为中国石油增储上产,发挥保障国家能源安全“压舱石”作用奠定更坚实的基础。
(转载请标明出处,文章来源:华夏能源网,微信号:hxny3060)