超聚变FusionOne AI单机跑满血DeepSeek,吞吐性能飙升60%

2025-03-24 20:36:52 0点赞 0收藏 0评论

如今,人工智能发展迅猛,大模型更是成为推动AI技术进步的“引擎”。然而,随着模型参数量的激增,算力需求也呈指数级增长,如何高效、低成本地运行大模型成为行业面临的共同挑战。

以DeepSeek R1满血大模型为例,其参数量高达6710亿,由于其采用了前沿的MLA注意力机制、共享专家和路由专家共同组成的混合专家(MoE)架构,在提升推理效能方面成果显著,但是企业在实际应用过程中,对大模型的性价比有着更为极致的追求。

近日,超聚变FusionOne AI大模型一体机通过软硬协同,深度调优,成功打破了H20运行DeepSeek满血大模型的性能天花板。在模拟问题对话场景(上下文序列长度1K/1K)下,仅需1台FusionServer G8600搭载8张H20硬件,即可流畅运行DeepSeek R1满血版,支持1024并发访问数,总吞吐量高达6335 token/s,性能领先业内H20方案60%。其中,TPOT(Time per Output Token)时延相比业内H20方案减少40%,单台FusionOne AI大模型一体机即可支撑数千人规模企业使用,将单机H20运行大模型的性能推向新高度。

超聚变FusionOne AI单机跑满血DeepSeek,吞吐性能飙升60%

软硬协同调优,打破 H20 性能天花板

  • 算力释放,显存最优分配:通过内核优化,提升显存空间利用率20%,KV cache池使用率提升至93%,保障模型参数、过程KV高效运行

  • 数据、模型并行调度:通过DP数据并行、TP模型张量并行技术,调度多卡分布式并行计算,提升token产生的吞吐效率50%,有效提升计算效能

  • 推理任务切片混合调度:Prefill阶段(首token输出阶段任务)长文本切片, 加速初始内容生成速度,同时在每个切片计算过程中,混合调度Decode任务(后续token迭代生成任务)并行运行, 无需串行等待,提高资源利用率,降低TTFT(Time to First Token)和TPOT(Time per Output Token )。

超聚变FusionOne AI大模型一体机以极致成本、性能跃升的双重突破,大幅降低DeepSeek-R1 671B模型的部署门槛,以普惠形态让更多企业和科研机构能够轻松应用。未来,超聚变将持续加大研发投入,聚焦AI算力优化与应用拓展,加速企业AI应用落地。

*本文图片均来源于网络

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

展开 收起

超聚变5V7【机架式服务器】 NAS存储 颗银牌4416+(.0G/C)64G丨块40G+块4T 丨RAID5丨双电

超聚变5V7【机架式服务器】 NAS存储 颗银牌4416+(.0G/C)64G丨块40G+块4T 丨RAID5丨双电

暂无报价

超聚变FusionServerG8600V7新一代旗舰级8U GPU异构服务器AI训练丨HPC丨计算 2颗8462Y丨64G*32丨960G*2 丨3.84T丨200g双口*2丨H800*4

超聚变FusionServerG8600V7新一代旗舰级8U GPU异构服务器AI训练丨HPC丨计算 2颗8462Y丨64G*32丨960G*2 丨3.84T丨200g双口*2丨H800*4

暂无报价

超聚变(原华为) 服务器硬盘1.2T SAS 10K企业级(含2.5托架)适用于2288HV3/2288HV5/HV6/2488HV5/5885HV5

超聚变(原华为) 服务器硬盘1.2T SAS 10K企业级(含2.5托架)适用于2288HV3/2288HV5/HV6/2488HV5/5885HV5

暂无报价

超聚变 (原华为) 2288HV5服务器 (双颗金牌6238R/56核2.2GHz/512G内存/5块2.4T 10K SAS硬盘/RAID5/双电) 2U 2*金牌6238R| 512G | 5*2.4T SAS

超聚变 (原华为) 2288HV5服务器 (双颗金牌6238R/56核2.2GHz/512G内存/5块2.4T 10K SAS硬盘/RAID5/双电) 2U 2*金牌6238R| 512G | 5*2.4T SAS

暂无报价

超聚变FusionServer 2288H V6 2U机架式 服务器主机虚拟化主机 2颗银牌4314 双电 256G 6块960G raid1 0 5

超聚变FusionServer 2288H V6 2U机架式 服务器主机虚拟化主机 2颗银牌4314 双电 256G 6块960G raid1 0 5

暂无报价

超聚变 FusionServer 2288HV5服务器 (双颗银牌4214R/24核2.4GHz/128G内存/6块2.4T SAS硬盘/RAID5/双电) 2U

超聚变 FusionServer 2288HV5服务器 (双颗银牌4214R/24核2.4GHz/128G内存/6块2.4T SAS硬盘/RAID5/双电) 2U

暂无报价

超聚变FusionServer 【5288V7】【机架式服务器】主机 2颗4410Y/64G/480G*2+14T*10 双电(含导轨)

超聚变FusionServer 【5288V7】【机架式服务器】主机 2颗4410Y/64G/480G*2+14T*10 双电(含导轨)

暂无报价

超聚变FusionServer 2288HV6 2U机架式 服务器主机 2颗6330/512G/960G*2+3.84T/ 2G缓存/双电/3年硬盘不还返服务

超聚变FusionServer 2288HV6 2U机架式 服务器主机 2颗6330/512G/960G*2+3.84T/ 2G缓存/双电/3年硬盘不还返服务

暂无报价

超聚变FusionServer2288H V5服务器主机2U机架式国产机数据库虚拟化深度学习主机 1颗

超聚变FusionServer2288H V5服务器主机2U机架式国产机数据库虚拟化深度学习主机 1颗

暂无报价

超聚变 配件 适用于2288服务器 影.驰RTX3060显卡

超聚变 配件 适用于2288服务器 影.驰RTX3060显卡

暂无报价

超聚变 配件适用于2288V3 2288HV5 2488V5 5885HV5 V6 服务器主机

超聚变 配件适用于2288V3 2288HV5 2488V5 5885HV5 V6 服务器主机

暂无报价

超聚变FusionServer 2488HV6 服务器主机8盘2U机架式国产机型云计算GPU电脑主机 4颗金牌5320H 80C 2.4G 双电 128G内存 2块480G固态 4块2.4T

超聚变FusionServer 2488HV6 服务器主机8盘2U机架式国产机型云计算GPU电脑主机 4颗金牌5320H 80C 2.4G 双电 128G内存 2块480G固态 4块2.4T

暂无报价

超聚变2288HV5服务器主机6242*2 256G 2*480G+8*2.4T+1*1.92T 2G阵列卡 4*千兆电口+2*万兆光口 双电源 超融合软件

超聚变2288HV5服务器主机6242*2 256G 2*480G+8*2.4T+1*1.92T 2G阵列卡 4*千兆电口+2*万兆光口 双电源 超融合软件

暂无报价

超聚变适用于2288HV5/2288HV6/2488V5/5288V5/5885HV5服务器主机 64GB DDR4 RDIMM 3200内存

超聚变适用于2288HV5/2288HV6/2488V5/5288V5/5885HV5服务器主机 64GB DDR4 RDIMM 3200内存

暂无报价

倍控 G30S-N100四网2.5G DDR5 准系统

倍控 G30S-N100四网2.5G DDR5 准系统

680元起

联想ThinkStation P3图形工作站高性能AI计算训练设计渲染建模主机 i3-13100/8G/512G/UMA/500W

联想ThinkStation P3图形工作站高性能AI计算训练设计渲染建模主机 i3-13100/8G/512G/UMA/500W

暂无报价
0评论

当前文章无评论,是时候发表评论了
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
相关好价
最新文章 热门文章
0
扫一下,分享更方便,购买更轻松