QR9286G3服务器是专为大推理模型(Large Reasoning Model)创新设计的高吞吐推理服务器,搭载双路英特尔至强6可扩展处理器,可支持16张标准PCIe双宽卡,提供高达1536GB显存容量,支持在FP16/BF16精度下单机部署DeepSeek 671B模型。8U空间内集成2个3U GPU模组、1个1U计算模组和1U供电模组,支持独立维护与灵活配置。创新研发基于PCIe Fabric的16卡全互连拓扑,任意两卡P2P通信带宽可达128GB/s,降低通信延迟超60%,目前已支持多元AI加速卡选配
单机部署DeepSeek V4/V3/R1 671B大模型,相较于传统2机8卡PCIe机型,性能提升近40%
支持万亿级大模型推理部署,整机最大提供16.5kW供电能力
8U空间支持16张标准双宽PCIe 加速卡或32张单宽加速卡,快速扩展统一高速互连域
节点内PCIe Switch之间采用创新的PCIe Fabric全互连拓扑,实现16张卡全互连,任意两张卡PCIe P2P通讯带宽可达128GB/s,降低通信延迟超60%,拓扑灵活可重构
节点间Scale out高速互联扩展,支持4.0Tbps无阻塞IB/RoCE组网,具备成熟集群方案
项目 | 描述 |
设备类型 | 8U机架式 |
处理器 | 支持2颗英特尔®第六代至强® 可扩展处理器,TDP 350 W |
内存 | 32条DDR5 DIMMs内存, 单内存每通道速率最高支持6400MT/s |
存储 | 最多支持4块2.5英寸U.2 NVMe硬盘或者8块E1.S NVMe SSD |
M.2 | 2块内置M.2 NVMe/SATA(可选),并且SATA支持硬RAID 0/1 NVMe支持软RAID 0/1 |
PCIe插槽 | GPU模组:支持16个FHFL双宽 PCIe 5.0 x16插槽,支持8个FHHL单宽插槽 计算模组:支持2个FHHL PCIe 5.0 X16插槽或者1个FHHL双宽 PCIe 5.0 X16插槽 |
RAID支持 | 支持RAID 0/1 |
前置I/O | 2个USB 3.0端口, 1个Type-C端口, 1个VGA端口,1个RJ45端口,1个MicroUSB端口 |
OCP | 可选支持1张OCP 3.0网卡, 支持NCSI功能 |
管理 | DC-SCM BMC管理模组 |
风扇模组 | GPU区域:15个8086 N+1冗余热插拔风扇 CPU区域:9个4056 N+1冗余热插拔风扇 |
电源 | 6块54V 3300W钛金级双输入CRPS电源,支持N+1冗余 |
尺寸 | 宽448mm,高352mm,深876mm |
重量 | 净重140kg(毛重:168kg) |
有任何关于驱动、固件、手册等售后问题,请发邮件给我们:
7*24小时服务邮箱service@maginfra.com