用存力赋能算力,让数据绽放价值!新华三用Polaris X20000打造AI时代的存储新标杆
发布时间:
2025-11-25
在日前举办的一场存储论坛上,合肥综合性国家科学中心人工智能研究院信息计算平台主任李诚副教授总结了中心智算业务在存储中遭遇的痛点:要让中心内的两套智算集群发挥峰值性能,存储系统至少需要提供70GB/s的实际数据吞吐量。如果要为后续发展规划预留40%性能冗余,那么存储系统的实际数据带宽至少要达到120GB/s;而这些都是现有存储集群所无法企及的。

以存力激活算力,让智算更高效
面向大规模模型训练与推理部署,存储的持续吞吐、元数据处理与多协议协同能力,直接决定任务排程效率与GPU占用率,是提升智算系统TCO与产出比的关键变量。AI训练、大模型归档与推理部署等任务,对存储带宽、IO并发和可靠性都提出了前所未有的挑战。
更高的性能:从当前业内情况看,大多数商用 AI 存储系统的单节点吞吐仍集中在40–70GB/s区间,只有少数高规格全闪方案能突破 80–100GB/s。之所以难以进一步提升,主要受限于元数据处理、协议栈开销、SSD写入放大以及网络抖动等结构性瓶颈。例如高并发小文件场景下,元数据请求量往往比数据流量更大,成为性能上限的主要限制因素。
更高的可靠性:存储系统宕机可能导致训练中断、模型状态丢失、结果损坏等严重损害,使整个集群不得不进行长时间重算;这对大模型训练尤其致命。例如 Meta 在训练 Llama3.1-405B(约万卡规模)时,整个54天训练周期累计发生466次节点中断,平均每2–3小时出现一次故障。频繁的训练中断不仅显著延长整体周期,还可能导致任务回滚、能耗上升、GPU 利用率下降等连锁成本。
更简便的运维:存储系统的高质量运维能够有效减少停机次数和时间,业内研究显示,在未采用智能化运维前,许多大型智算集群会出现每周多次IO抖动,导致GPU利用率下降 10%–30%。在引入智能监控与主动修复机制后,异常频率通常能下降至月级别,GPU利用率则显著提升至90%以上。
国产化生态:随着国产算力体系的快速发展,存储领域的国产化需求也日益增强。存储系统不仅需要在处理器、内存、高性能网卡、NVMe硬盘等一系列核心部件的选用上拥抱国产,软件层面还应与NingOS、麒麟、统信、openEuler等国产操作系统保持兼容,以软硬结合的方式构筑更完整的国产业务生态。

全维进化,打造AI时代的全能存储
H3C Polaris X20000系列是新华三面向AI与智算时代打造的高性能分布式存储系统。它以全新的架构设计和智能化管理理念,为AI训练、推理、数据预处理与多模型协同等场景提供持续、高效的数据通路。通过多协议融合、智能调度与可视化运维工具,X20000能够显著提升算力利用率,让数据加载、模型归档与任务分发更加顺畅,从而加速智算中心的整体业务效率。

超强性能:全球权威AI性能基准评测组织MLCommons®公布的最新一轮MLPerf® Storage v2.0基准测试结果显示,Polaris X20000以单节点159.92GB/s、集群总带宽476.75GB/s的优异成绩,登顶高性能RoCE AI存储解决方案榜首。RoCE(RDMA over Converged Ethernet)凭借高带宽、低时延和更优的TCO,正在成为智算中心的主流网络架构。基于高性能RoCE网络,Polaris X20000在测试中取得的性能数据更贴近用户实际的智算场景,具有更高的参考价值。
测试数据显示,Polaris X20000所提供的超强性能可减少30%的系统加载时间,满足320颗GPU集群运行对存储带宽的需求,让智算集群始终保持90%以上的GPU利用率,真正做到物尽其用。
协议融合:Polaris X20000同时提供了对文件、对象、HDFS等常见存储协议的支持。例如在典型的AI训推业务中,Polaris X20000支持的对象存储协议(S3)便可应用于数据的归档、清理和大模型训练场景中,而文件存储协议(NFS)则可应对元数据存储和小模型训练。如此一来,用户便可使用同一套存储集群来应对多种AI业务的需求,既能做到物尽其用,也能免去多套存储集群同时使用所带来的数据同步和拷贝耗时。
稳定可靠:新华三采用了软件硬件两手抓的方式来提升Polaris X20000的整体可靠性。软件层面,新华三在系统中内置了硬盘寿命预测、磨损均衡、坏盘/慢盘修复、网络丢包/错包/抖动检测等一系列实用功能;而在硬件层面,新华三则提供了基于硬件信号的故障检测和毫秒级上报、硬件全冗余和热插拔设计,来提升底层可靠性。Polaris X20000不仅能实现无需停机的部件更换,更可将故障误报率、故障检测时间、业务恢复速度等关键指标降低为原先的十分之一,让系统整体可靠性大幅提升。
在场景中发挥效用,用业务来证明价值
在日前以“智存无界,数智跃迁”为主题的新华三AI智算数据存储应用论坛上,包括合肥综合性国家科学中心人工智能研究院、并行科技等典型用户集体登台,从自身业务特性和场景出发,分享了智算存储的具体实践和业务收益。
01、助力科研,开启脑科学新篇
人类大脑由数千亿个神经突触构成,新一代脑科学家们正在使用电镜扫描来将生物大脑“数字化”,并用AI模型来分析大脑功能。李诚介绍:1立方厘米的人脑皮层电镜扫描会产生2PB的数据,并形成数千万个小文件。合肥综合性国家科学中心人工智能研究院正在使用新华三智算存储,这为未来算力升级提供了充足的存储带宽支撑;还通过全闪和混闪型号的配合使用获得了更好的效费比。
02、站上云端,服务产业未来
目前并行科技运营着数十个算力集群,业务涵盖高性能计算和AI业务,以某大型装备制造企业为例,并行科技的算力集群已经替代传统工作站,成为该用户运行流体力学、材料计算、结构设计等工业仿真软件的主力平台。而在这些算力集群后端,以Polaris X20000为代表的新华三分布式存储设备则为并行科技智算平台提供了高性能的存储和IO支持。同时,作为并行科技的紧密合作伙伴,双方还建立了联合实验室,围绕存、算、网、安和国产算力等领域推出了一系列创新解决方案。
一个是国家级的科研中心,另一个则是云化高端算力的行业翘楚。两大尖端用户的同时站台不仅证明了新华三Polaris X20000系列分布式存储在技术和产品层面的绝对实力,更意味着其背后的新华三工程和方案服务能力足以撑起各类关键业务的高标准需求。
让存力赋能算力,让数据绽放价值!显然,技术领先、性能拔群,且在功能、可靠性、易用性、工程服务能力等方面经过实践验证的新华三Polaris X20000已经能够胜任AI时代各类新业务的挑战,成为海量用户拥抱AI时代的理想基座。
上一页
上一页
Related News
相关资讯
2025-12-03