中国电信商用智算超节点推理性能实现新突破
人民邮电报:2025/8/22 16:09:40
随着人工智能业界大模型从稠密架构向以DeepSeek为代表的多专家混合模型(MoE)架构演进,基于高端智算能力的云上推理成为当前技术演进的趋势和必然需求,高效率推理性能成为智算资源提供领先者的核心竞争力。
近日,中国电信广东公司联合中国电信研究院、华为,基于中国电信粤港澳大湾区(韶关)算力集群,上线全球首个商用昇腾超节点智算集群,采用中国电信研究院自研"翼芯"智算测试与适配优化平台,针对多种推理场景开展了大模型性能优化及测试。通过对主流模型与超节点系统迭代适配调优,不同场景下的推理性能均实现了大幅提升;其中DeepSeek 671B满血版模型达到单卡推理吞吐性能2122Tokens/s,刷新了业界纪录。
昇腾超节点系统创新应用全总线架构,采用高速互联技术,将384张910C智算卡紧密耦合,形成大型算力单元。该架构在大幅降低模型并行通信时延的同时,还需要解决好资源调度与并行策略设置复杂性变高的问题;需要针对不同业务场景的资源和并发策略进行灵活设置,才能最大程度发挥算力单元整体性能,将算力单元与大模型的亲和度提升至最佳。
本次中国电信和华为合作,完成翼芯测试平台与昇腾384卡超节点对接优化,针对13项基准性能、6类典型场景推理性能,采用5类典型资源配置开展自动化测试;同时尝试采用算子融合替换、PD分离调度、KV cache优化、集合通信优化、并行策略优化等多维度的调优策略,不断将吞吐性能提升到最大。经充分优化后,DeepSeek 671B模型在多种场景下的单卡吞吐性能较优化前提升2.5~4.3倍;在保证TTFT为1.28s、TPOT为50ms的服务质量指标下,单卡吞吐性能达到2122Tokens/s,较业界前期测试最佳性能提升9.2%。
本次超节点优化和性能指标刷新,展示了中国电信对智算系统整体优化核心技术的深刻理解与实践创新能力。超节点可以根据客户实际需要,灵活配置智算资源池资源,更高效地服务于复杂推理、多智能体协同等新业务场景。
下一阶段,中国电信将开展更多场景的超节点形态优化研究和验证测试,持续推动国产智算基础设施建设和技术创新,全面助力人工智能产业高质量发展。(陈新豪 师春雨)
转自:人民邮电报
- 上一篇:中央精神文明建设办公室等5部门联合发布2025年全国“新时代好少年”先进事迹
- 下一篇:没有了
图库
- 中国电信商用智算超节点推理性能实现新突破
- 中央精神文明建设办公室等5部门联合发布2025年全国“新时代好少年”先进事迹
- 三大电信运营商2025年中期业绩分析
- 我国人工智能专利数占全球总量60% 数据企业数量超40万家
- 中国“智”造大放异彩 机器人产业迎来诸多“高光时刻”
- “中国游”悄然升级:搭建民间交流桥梁 让外国游客“零距离”感受中国魅力
- 2025年上半年国内居民出游数据情况
- 6月末普惠小微贷款同比增16.9%
- 2023年度全国星级旅游饭店统计调查报告
- 2024年一季度国内旅游数据情况
- 2024年第一季度全国星级旅游饭店统计调查报告
- 2023年前三季度国内旅游数据情况
- 我国技能人才总量超过2亿人
- 用“真金白银”支持“以旧换新”补贴加码 优惠直达消费者
- “数”说我国交通运输经济运行总体平稳 主要指标保持增长
- 我国交通运输领域技术设备呈现更智能、更绿色、更安全新趋向
- “热点更热、冷点不冷”国庆假期全国路网出行总量大 流量峰值高
- 稳增长稳楼市政策加码 助力提振市场信心