国内首个开放架构AI超集群系统发布

国内首个开放架构AI超集群系统发布

发布时间：2025-09-09 11:30:32 　发布者：本站编辑

【导(dǎo)语(yǔ)】9月(yuè)5日(rì)，中(zhōng)科(kē)曙(shǔ)光(guāng)在(zài)2025世(shì)界(jiè)智(zhì)能(néng)产(chǎn)业(yè)博(bó)览(lǎn)会(huì)上(shàng)发(fā)布(bù)国(guó)内(nèi)首(shǒu)个(gè)基(jī)于(yú)AI计(jì)算(suàn)开(kāi)放(fàng)架(jià)构(gòu)的(de)曙(shǔ)光(guāng)AI超(chāo)集群(qún)系(xì)统(tǒng)，该(gāi)系(xì)统(tǒng)以(yǐ)GPU为(wèi)核(hé)心，实现“算、存、网”等多要素一体化紧耦(ǒu)合(hé)设(shè)计(jì)，具(jù)备(bèi)高(gāo)性(xìng)能(néng)、高(gāo)效(xiào)率(lǜ)等(děng)特(tè)性(xìng)，可应对国内AI算力领域多重挑战，还开放多项技术能力助力产业协作。

9月5日，中科曙光在2025世界智能产业博览会上发布了国内首个基于AI计算开放架构设计的产品——曙光AI超集群系统。

记者在现场了解到，这一AI超集群系统以GPU为核心，实现了“算、存、网、电、冷、管、软”一体化紧耦合设计，具备“超高性能、超高效率、超高可靠、全面开放”四大特点，可为万亿参数大模型训练推理、行业大模型微调、多模态大模型开发、AI4S等场景提供高效算力底座。

据介绍，曙光AI超集群系统具有高性能、高效率、高可靠、全面开放的技术特点。比如，在性能方面，单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s，支持多精度、混合精度运算以及百万卡超大集群扩展；效率方面，千卡集群大模型训练推理性能达到业界主流水平2.3倍，开发效率提升4倍。

当前，伴随AI大模型快速演进以及全球IT产业生态体系调整，国内AI算力领域面临高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等挑战。而发展更大规模、更高效智(zhì)算(suàn)集群(qún)来(lái)弥(mí)补(bǔ)国(guó)产(chǎn)单(dān)卡(kǎ)算(suàn)力(lì)差(chà)距(jù)以(yǐ)突(tū)破(pò)算(suàn)力(lì)瓶(píng)颈(jǐng)，打(dǎ)造(zào)开(kāi)放(fàng)式(shì)、标(biāo)准(zhǔn)化(huà)、高(gāo)效(xiào)率(lǜ)的(de)算(suàn)力(lì)集群，以实现智算集群的易用与可控成本，正逐渐成为业界共识。

值得关注的是，相比封闭系统，曙光AI超集群系统不仅通过紧耦合设计像一台计算机般高效工作，还支持多品牌AI加速卡以及兼容主流软件生态，为用户提供更多开放性选择，并降低硬件成本和软件开发适配成本，保护前期投资。

中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示，克服国内AI算力多维挑战，需汇聚芯片、计算系统、大模型等产业链多方力量，构建开放AI计算架构并拉通产业间跨层协作，以打破“技术墙”与“生态墙”。据他透露，依托AI超集群系统，中科曙光将开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项技术能力，助力合作伙伴、重点用户在AI应用存储性能加速、液冷超节点系统设计、GPU开发统一开发框架等方面获得高级别技术共享、深度定制优化与专业技术支持。

- 国内领先的先进封装制程解决方案提供商

最新消息

关于我们

制程解方案

人才招聘

社会责任

最新消息

联系我们

关于我们

解决方案

联系我们