文|智能相对论
作者|叶远风
数字经济大时代,创新驱动大环境,HPC已不再是阳春白雪,而受到越来越多人的关注。
HPC,即High Performance Computing,高性能计算。对普通人来说,没有听过HPC,但肯定都听过超级计算机,它就是HPC的主要实现方式之一。
对越来越需要高复杂度计算的学界与产业界来说,HPC的重要性不言而喻。
最近,2022 CCF全国高性能计算学术年会(CCF HPC China 2022)在线上举办,吸引了国内外学界、产业界众多专家、从业者参会。
CCF HPC China是HPC领域全球最有影响力的三大超算盛会,另外两家分别是德国的ISC超算盛会、美国的SC超算盛会。
最前沿的学术成果汇聚与交流,为HPC的发展再添了一把火。
这次会上,《开放架构 HPC 技术与生态白皮书》(以下简称“白皮书”)发布,有关全球HPC最新发展状况与发展动向被阐明。
值得注意的是,ARM指令集兼容架构登上HPC舞台,展示出“皇冠上的明珠”般璀璨的光芒。
ARM指令集兼容的HPC进入全球大发展时代
从时间上看,HPC并不是新的字眼,毕竟超级计算机的发展已经有数十年了。但HPC始终保持着旺盛的活力。
如今的HPC,在算力上已经进入了E级时代。
这个时代与过去有着显著的不同:
ARM 指令集兼容的架构成为HPC的主要路线之一,用于支撑起E级算力的要求。
HPC的计算芯片也从过去十几年基于一种或几种完全封闭的指令集,走向由不同厂家生产、但指令集能够兼容的产品所构成。
“ARM”成为一种共同遵循的标准,而不具体指代某个下场参与HPC的产品。
HPC的参与者变得更加自主,HPC的实现方式也能够创新频出。
于是,指令集兼容、差异化实现、可自由演进,这种架构也就是白皮书提到的“开放架构”,能够百花齐放,不断适应市场需要。
如同生物界的进化,HPC这种走向“开放架构”的进化,也是“自然选择”的结果。白皮书提到,厂家、生态及产业链伙伴持续多年的战略定位、技术与投资,造就了ARM指令集兼容HPC的繁荣。
这背后的动因,是ARM 指令集在HPC方面相对传统架构有明显的优势。
芯片性能不断提高且更多核心支持的特点更适合HPC大规模并行的发展趋势,同样的体积能部署更多的算力,鱼和熊掌兼得;
完善的指令集在HPC的特殊工作负载上有优势,且加强了对矢量、矩阵计算等工作的支持;
访存性能更强,计算足够优秀还不忘与其他配套设施打好配合;
……
当然,专门的安全模块所带来的安全性同样十分重要。
全球主要算力高地,都在将ARM 指令集兼容架构融入到国家高性能计算建设战略当中:
无论中国的高性能专项,还是日本 FLAGSHIP 2020 计划,以及欧洲的EuroHPC计划,都做了基于ARM指令集的超算系统。美国的Venado等超级计算机也宣告ARM指令集兼容成为美国超算建设的一个方向之一。
ARM指令集兼容的HPC,正在高歌猛进。
从技术、生态到产业落地,中国HPC再现全产业链优势
短短十年间,凭借全产业链优势,中国在很多前沿技术上由跟随者变成了探索者。
在ARM指令集兼容的HPC这里,这一优势再度彰显。
从白皮书来看,无论是技术创新、生态共建还是产业落地,中国在HPC的新发展方向上都表现出全面进发的态势。
有底层的技术发展驱动力,有生态平台推动枝繁叶茂,有产业落地让价值坐实最终反馈到技术与生态,全链条形成了一个不断自增强的发展循环。
首先,在技术上,ARM 指令集兼容HPC所需要的多层次内容已经趋近完善,一个从行业宏观视角看的“全栈”技术体系在走向成熟。
硬件方面,国内基于 ARM 指令集兼容架构的服务器芯片厂商出现了包括华为的鲲鹏、飞腾、阿里平头哥等在内的典型厂商。
系统层,国内拥有openEuler开源操作系统、银河麒麟等操作系统,对鲲鹏、飞腾芯片已经实现了很好的适配,并在行业得到了广泛应用。
编译层,华为的毕昇编译器面向鲲鹏处理器进行了深度优化,实现了较高的性能,此外,国防科大编译团队的“天鹰编译系统”则专门面向飞腾处理器进行了优化。它们在能力上已经能够对标在国内外服务器领域应用广泛的亚马逊编译器、Ampere 编译器等。
平台层,国内目前代表产品有鲲鹏应用使能套件 Kunpeng BoostKit 和鲲鹏开发套件 Kunpeng DevKit,前者主要帮助开发者实现应用的极致性能,让各种场景的开发者都能获得特定的、与硬件性能匹配的增益;后者主要帮助开发者实现极简开发,开发出鲲鹏亲和的高性能软件,加速原生开发效率。
在最后的应用层,面向电磁仿真、材料计算、分子动力学、生物信息、计算物理、气候气象、金融分析等不同领域,不同的行业应用不断产生。
例如,在气候海洋领域,典型开源软件WRF已经在基于飞腾处理器的天河系统、基于鲲鹏处理器的HPC系统上运行,有效帮助气候预测、规避气象灾害。
在医学影像领域,鲲鹏平台已适配常用图像处理软件,随着医学影像库的数据规模达到 TB 级,HPC将发挥重要价值。
其次,在生态上,越来越多的产业伙伴在加入属于中国的ARM指令集兼容HPC阵营当中,这反过来又推动HPC的新趋势在中国加速落地。
目前华为、飞腾两家厂商的产品已经收获了越来越多的合作伙伴,为开放架构HPC的广泛应用做好了准备。
其中,基于鲲鹏芯片的TaiShan系列服务器就推出有专门面向HPC的高性能型,全球已经有 10 家整机厂商基于鲲鹏芯片推出自由品牌服务器,应用在制造、交通、交通、金融等不同领域。
飞腾用于商业 HPC 的服务器芯片达到了3款,背靠着企业本身超4500+生态伙伴与300余家集成商,在ARM 指令集兼容HPC领域同样大有可为。
随着华为将openEuler欧拉贡献出去,更多的生态伙伴还在共同推动HPC基础软件的完善。
目前为止,面向企业级的开源操作系统欧拉已经构建起拥有全球开发者积极参与的操作系统开源社区,代码仓库逼近1万,贡献者超1.2万,社区用户已突破100万。在这样的基础之上,欧拉累计装机量达到245万套,在服务器操作系统的新增市场份额不断提升,为HPC的发展提供了更优的操作系统选择。
另外,麒麟软件等数十家基础软硬件企业、非营利性组织、社团组织、高等院校、科研机构和个人开发者共同创立了开源社区 OpenKyling,这个社区也正在推动其 ARM指令集兼容架构上的开放操作系统发布。
最后,是广泛的市场让ARM指令集兼容HPC能够快速证明自己、产生价值,从而反哺技术与生态,更好地前行。
白皮书显示,在中国,ARM 指令集兼容架构已在多种类型的头部客户获得深入成熟使用。
在高校,典型如上海交通大学上线了国内高校首个基于鲲鹏的校级HPC系统,采用双路鲲鹏处理器作为节点,为用户提供18 款常用的高性能计算软件,覆盖材料科学、生命科学、大气科学和流体力学 4 大HPC应用领域,2021年4月开放至今服务了74 个课题组,计算作业数量超 100 万个。
在超算中心方面,国家超级计算济南中心、天津中心、长沙中心及武汉超算中心等都建设有基于鲲鹏处理的系统。
在制造业,上汽大众借助华为鲲鹏高性能解决方案扩容 HPC 仿真系统,满足了业务高速扩展下的研发效率提升需求,缩短产品开发周期、提升产品质量、降低设计成本。
在运营商赛道,浙江移动的大数据平台充分发挥ARM 指令集兼容架构的鲲鹏优势,打破了数据分析耗时瓶颈,提升了整体性能。
此外,在金融业,飞腾的ARM指令集兼容集群在金融业得到了广泛应用,满足了行业深刻的去IOE需要。
几乎在所有需要计算的产业领域,都在出现ARM指令集兼容HPC的踪迹,并以其实际价值获得了广泛认同。
ARM指令集兼容,让HPC走出全新路线
ARM指令集兼容,是HPC技术的一次“变调”。前述所有内容,都在表明HPC产业界在这方面已经做好了充分的准备,只待更多玩家的加入。
对HPC领域的参与者来说,下一步,在生态开放、技术自主的理念下,加入到ARM指令集兼容HPC路径上来,共同推动这一生态加速发展、实现共赢,将成为更好的选择。
*本文图片均来源于网络
此内容为【智能相对论】原创,
仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。
•AI产业新媒体;
•澎湃新闻科技榜单月度top5;
•文章长期“霸占”钛媒体热门文章排行榜TOP10;
•著有《人工智能 十万个为什么》
•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。