首页 > IT业界 > 正文

为科研量身定制,优刻得推出“云极”高性能计算EPC

2021-02-02 10:54:15  来源:搜狐

摘要:随着数字化走向纵深,科研教育进入信息化时代。在科研项目的推进过程中,往往会面对复杂的数据密集型计算任务,例如仿真、数据建模、渲染等大量运算场景。
关键词: 优刻得
随着数字化走向纵深,科研教育进入信息化时代。在科研项目的推进过程中,往往会面对复杂的数据密集型计算任务,例如仿真、数据建模、渲染等大量运算场景。此时如果使用单一的通用物理计算主机,会因为计算数据量庞大、算力性能有限,从而导致计算效率大大降低,甚至根本无法执行计算。而HPC高性能计算集群的出现,通过将多个单元的计算能力进行整合,打破了算力性能的局限,成为了科研攻坚时不可或缺的利器。

两款新机型+两项场景优化

2020年,优刻得在业内首先发布了具有自由弹性、超强算力的“启慧科研云”,而“启慧科研云”超强算力的背后,正是优刻得自主研发的第一代高性能计算产品UHPC。相比传统的HPC超算数据中心,基于“云”的UHPC拥有海量资源、弹性扩展、灵活部署、数据安全等诸多优势。为了满足在更多复杂场景科研攻坚时,对于超高性能算力、高速网络传输、海量数据存储的更高需求,优刻得再次发力,于近日推出了为科研量身定制的新一代超算产品,并将UHPC正式更名为“‘云极’高性能计算 EPC”(以下简称UCloud EPC)。

\

“云极”旨在为用户提供基于公有云技术的超高性能算力体验。相比上代产品只提供单一快杰云主机机型,UCloud EPC新增快杰裸金属云主机、快杰Lite云主机两款超算机型:

> 快杰裸金属云主机基于NVIDIA最新系列 BlueField DPU打造,通过DPU集成的多核ARM CPU,快速将快杰云主机的基础架构软件从x86迁移到DPU中,在减少宿主服务器CPU系统资源占用率的同时,有效提升CPU性能稳定性,让快杰裸金属云主机在具备快杰云主机弹性灵活高性能诸多特性的同时,做到了物理机级别的资源隔离。快杰裸金属云主机目前可提供最高规格为CPU 96核心,内存576GB的实例。

> 快杰Lite云主机采用Ampere Altra处理器,基于ARMv8.2指令集,使用知名的Phoronix测试套件PTS测试HPCG(High Performance Conjugate Gradients,高度共轭梯度)成绩为20.77 GFLOP/s,相较于同规格的快杰云主机(x86架构)性能提升40%。快杰Lite云主机在生物信息学、空气动力学模拟、气象预测模拟等超算应用场景中,优势更为凸显。

针对业内HPC在科研场景遇到的一些问题,UCloud EPC还进行了两项优化:

针对普通云盘性能较弱,RSSD云盘存储费用较高的问题,UCloud EPC增加了对高效云盘与网络文件存储的支持,可有效降低存储成本40%。其中,全新上线的网络文件存储支持标准原生的SMB 3.1+文件访问协议,并同时支持Linux系统和Windows系统。网络文件存储内网接入带宽为25Gbps的RDMA高速网络;客户端访问网络文件存储实际带宽可达400MB/s。

针对科研计算数据上传下载过程中的网络传输优化,UCloud EPC新增对教育网专线的接入与盘柜直通租赁服务,以及针对百度云盘和钉钉网盘两款主流网盘客户端的定向加速。用户只需通过专属域名(instance_name.edu.ucloud.cn)即可实现就近接入教育网络专线,并高速访问UCloud EPC云主机。用户还可根据自身数据规模大小(1TB以内的数据建议使用云主机专属域名,百度云盘或者钉钉网盘;1TB以上的数据建议使用盘柜租赁)选择通过多种方式和渠道,将数据快速上传至UCloud EPC进行科学计算。计算完成后亦可通过上述渠道快速迁移计算结果到用户本地环境,大幅提升数据上云下云效率,加速科研进程。

突破科研IT痛点,UCloud EPC三大优势

以本地机房、硬件部署、内外隔离为特点的科研机构传统IT架构,已无法满足科研场景弹性扩容、跨域协同、灵活部署的需求。而以云计算为基座的UCloud EPC,通过性能强大、高效协同、灵活部署的高性能计算方案,将打破科研算力瓶颈,释放科研发展活力。具体而言,相比科研机构传统IT及普通HPC,UCloud EPC具有以下三大优势

一、性能强大、提升效率

UCloud EPC 搭载业内最新一代CPU、GPU芯片,以高性能快杰云主机、快杰裸金属为基座,可秒级快速启动HPC集群。EPC与优刻得大数据、AI等产品结合,提升科研算力和算法创新。

二、高效协同、数据安全

科研机构传统IT架构,通常使用科研机构或者高校内部机房,校园网与外网隔离,导致无法与外部科研团队或机构高效协同。UCloud EPC基于优刻得公有云平台,可实现跨地域协同、多团队配合;同时,优刻得在公有云安全措施上的严密防护,也规避了以往本地机房容易遭遇攻击或硬件受损等,带来的数据安全问题。

三、灵活部署、降低成本

使用UCloud EPC,科研机构无需一次性购买大量硬件,可按算力使用需求灵活配置,并按实际使用量付费,需求高峰时无需排队、需求低谷时避免资源浪费。UCloud EPC与优刻得云原生、数据分析、AI产品结合,可提高研发效率,降低运维成本。

UCloud EPC助力高校科研应用创新

目前,UCloud EPC已为多个科研教育项目的落地以及传统IT架构HPC上云提供服务:

哈尔滨某高校科研教育项目

哈尔滨某高校科研团队在遇到本地计算资源不足、计算性能不高等瓶颈后,主动联系优刻得寻求超算性能方案。借助高性能的UCloud EPC快杰裸金属云主机、弹性灵活的UCloud EPC快杰云主机,同样的CFD算例,迁移至云上之后,速度达到本地高性能工作站的两倍,将原本至少10天以上的计算任务,缩减至仅需5天即可完成。UCloud EPC助力推进科研项目、加速科研产出成果。

上海某高校科研教育项目

上海某高校科研团队在开展大规模的流体-固体耦合计算进行科研攻关时,对耦合计算要求高性能CPU、大内存和大容量存储提出了更高要求,但本地服务器资源紧张、配置固化、不易扩展,严重制约了科研工作的开展。在得知UCloud EPC“快杰版”云主机搭载了最新一代的高性能芯片,具备内存可指定、存储支持热态扩展等灵活性,科研团队决策快速上云,最终让该科研项目将原本需要20天以上的耦合计算加速至一周内完成,且实现了TB级数据的线下迁移。

江苏某高校科研项目

江苏某高校材料研究团队在科研攻关过程中,需要进行大体系计算。本地集群资源的不足,限制了计算速度;又逢校区搬迁,物理机柜在整个迁移过程中无法使用。计算慢、但科研速度不能慢;机柜停、但科研工作不能停。UCloud EPC强大的算力性能与灵活易部署的特点有效破解了两大难题,客户经过短期试运行材料学计算软件,证实了性能显著优于本地计算资源。随即开展了长周期、大负荷的高性能计算。

上海某高校生命科学科研项目

冷冻电镜正在成为生命科学研究的重器和利器,上海某高校走在冷冻电镜领域的前沿。冷冻电镜离不开高性能计算,大量的电镜数据需要借助诸如Relion等应用软件进行分析和处理。优刻得提供的高性能CPU+GPU异构计算能力,显著提升了Relion的运行速度。此外,针对TB级计算数据的迁移,优刻得为用户提供了方便快捷的线下迁移服务,做到了TB级数据一站式上云、异构计算工作快速展开。UCloud EPC一站式服务,助推前沿科技研究。

华中某高校耦合计算项目

多物理场景的耦合计算,正在成为机械工程、航空航天等领域的核心手段。但耦合计算过程中,对算力性能有着超高的要求。华中某高校课题组在耦合计算时遇到了本地资源不足的问题。借助UCloud EPC超算性能,突破了原有的计算瓶颈,实现了工程应用级别的耦合计算,在短时间内成功交付高质量的科研成果。UCloud EPC为该高校科研团队扫除了算力障碍、构筑性能超算平台。

蓝威技术传统HPC上云项目:

蓝威技术是工程仿真领域的创新企业,致力于为客户提供SaaS化开箱即用的工程HPC服务。UCloud EPC为蓝威技术带来了在灵活配置(资源随时供应、灵活调整)、高性能(云主机性能优于原有物理机达30%)、弹性(大业务到来时随时启动新集群,最终用户无需排队)、顺畅连接(优刻得高速跨域网络接入,显著提升用户体验)等全方面的服务。比之前传统架构的部署模式,性能提升30%,成本降低30%,助力蓝威技术实现降本增效。

科研是科技创新的基础,而高性能计算则是科研的基石。未来随着产业数字化、智能化深入发展,基于云计算技术的UCloud EPC,将助力更多科研机构打破性能算力的瓶颈,赋能科技敏捷创新,推动科技产业加速发展。

用户难题痛点FAQ

Q:

1)用户自有超算中心不支持某类计算任务怎么办?

2)用户自购服务器资源老旧算力不足怎么办?

实际案例:

某高校用户超算CFD 计算任务需要在Windows平台运行计算任务,但校级超算中心不提供Windows计算平台,使用自购的服务器(基于Intel Cascade Lake铂金版8276L处理器)计算该任务又反映计算速度太慢。

EPC如何解决:

快杰裸金属云主机支持Windows平台,并且在同样的网格数计算量下,比用户自购服务器计算时间缩短一倍。2天的计算成本仅为800元。

亮点:

快杰裸金属云主机以AMD EPYC(霄龙)第二代处理器为底座,最高时钟频率可达 3.4GHz

Q:用户计算完成后,数据回传速度太慢怎么办?

实际案例:

某能源科技用户在优刻得云平台上完成高性能计算后,使用EIP(5Mb/s带宽计费模式)把计算结果回传至钉钉网盘,因为受限于EIP带宽限制,传输速率为600Kb/s。大大影响数据下云效率。

EPC如何解决:

为满足科研教育用户数据管理习惯,支持百度云盘和钉钉网盘客户端做定向加速,提升用户数据上云下云效率。为教育网内高校用户接入教育网线路,方便高校用户访问公有云,并为云主机配有专属域名:instance_name.edu.ucloud.cn。

亮点:

百度云盘:购买百度VIP会员后实测上传速度可达160Mb/s

钉钉网盘:下载速度可达160Mb/s

Q:用户计算需要配置超大云盘,普通云盘性能不足,RSSD云盘成本太高怎么办?

实际案例:

某基因类用户在优刻得云平台上进行高性能计算,使用10TB的RSSD云盘,每月需要支出存储费用6000元。

EPC如何解决:

高效云盘和网络文件存储的单价为0.35元/月/GB,成本下降40%。

亮点:

网络文件存储支持标准原生的SMB 3.1+版本,该版本已针对小型随机读/写I/O进行了优化。此外,默认情况下打开大型最大传输单元(MTU),这将大幅提高大型连续传输性能。客户端访问网络文件存储实测带宽可达400MB/s。100GB数据只需4分钟即可完成传输。

Q: 用户计算完成后,计算结果为海量数据(TB级数据),数据无法下云怎么办?

实际案例:

某高校用户在优刻得云平台上完成高性能计算后,需要把5TB的计算结果数据下云,使用EIP(5Mb/s带宽计费模式)下载至客户本地需要97天。

EPC如何解决:

盘柜租赁,数据送到家。

亮点:

以5TB数据为例,一周内可完成数据迁出优刻得数据中心,数据运输和数据同步到用户电脑的全流程。


第三十二届CIO班招生
法国布雷斯特商学院硕士班招生
北达软EXIN网络空间与IT安全基础认证培训
北达软EXIN DevOps Professional认证培训
责编:chenjian