序号
| 货物名称
| 招标技术要求
| 投标技术响应
| 偏离情况
| 说明
|
1.1
| 管理节点
| – ▲单节点配置两路64bit x86通用处理器(单个处理器≥18核/2.3GHz, 双精度浮点运算理论峰值≥1.3TFlops, TDP≤140W);
– ▲单节点配置内存≥384GB (12*32GB),内存条≥32GB, DDR4 2666 MHz RDIMM;
– 单节点配备≥4x1.2TB SAS 10K RPM硬盘,硬盘支持热插拔;支持扩展至≥12个2.5英寸HDD/SSD
– ≥1块12Gb SAS/SATA Raid卡,带≥2GB可读写Flash缓存(具备缓存数据掉电保护功能),支持Raid0/1/10/5/50/6/60
– ▲≥1个100Gb/s网络适配器
– ≥4个10Gb网口
– 提供KVM-OVER-IP功能。
– ▲提供(N+N)冗余白金级热插拔电源, (N+1)冗余风扇,支持热拔插
– 配置远程管理模块和独立远程管理网口
– 数量:≥ 3台
|
|
|
|
1.2
| 登陆节点
| – ▲单节点配置两路64bit x86通用处理器(单个处理器≥18核/2.3GHz,双精度浮点运算理论峰值≥1.3TFlops, TDP≤140W);
– ▲单节点配置内存≥384GB (12×32GB),内存条≥32GB, DDR4 2666 MHz RDIMM;
– 单节点配备≥4×1.2TB SAS 10K RPM硬盘,硬盘支持热插拔;支持扩展至≥10个2.5英寸HDD/SSD
– ≥1块12Gb SAS/SATA Raid卡,带≥2GB可读写Flash缓存(具备缓存数据掉电保护功能),支持Raid0/1/10/5/50/6/60
– 支持扩展≥两块专业GPU卡
– ▲≥1个100Gb/s网络适配器
– ≥4个10Gb网口
– 提供KVM-OVER-IP功能。
– ▲提供(N+N)冗余白金级热插拔电源, (N+1)冗余风扇,支持热拔插
– 数量:≥ 4台
|
|
|
|
V2.1
| 通用计算节点
| – ▲单节点配置两路64 bit x86通用处理器 (单个处理器≥20 核, 2.4 GHz, 双精度浮点运算理论峰值≥1.5TFlops, TDP≤150W);
– ▲单节点配置内存≥192GB (12×16GB),内存条≥16GB, DDR4 2666 MHz RDIMM;
– 单节点配备≥1×240GB SSD硬盘,硬盘支持热插拔;
– ▲≥1个100Gb/s网络适配器
– ≥1个10Gb网口
– ≥1个1Gb网口
– 投标节点系统的密度应≥1.5(单个机框内支持的最大节点数/单个机框的U数,如10U机框内最多支持14个节点,则密度为:1.4)
– 提供KVM-OVER-IP功能。
– 配置满足节点要求的机箱及附件,机箱要求模块化设计,电源,风扇,管理,网络等主要模块支持热插拔。
– ▲提供(N+N)冗余白金级热插拔电源,冗余风扇,支持热拔插
– ★性能:LINPACK总体理论峰值≥2.5 PFlops
– 数量:≥815 台
|
|
|
|
V2.2
| GPU节点
| – ▲单节点配置两路64 bit x86通用处理器 (单个处理器≥20 核, 2.4 GHz,双精度浮点运算理论峰值≥1.5TFlops, TDP≤150W);
– ▲单节点配置内存≥384GB (12×32GB),内存条≥32GB, DDR4 2666 MHz RDIMM;
– ▲单节点配备≥5TB SSD,硬盘支持热插拔;
– ≥1块12Gb SAS/SATA Raid卡,带≥2GB可读写Flash缓存(具备缓存数据掉电保护功能),支持Raid0/1/10/5/50/6/60;
– 单节点配备≥1×240GB SSD OS 硬盘,硬盘支持热插拔;
– ▲单节点配置≥2块 GPU卡;单块GPU卡双精度浮点运算理论峰值≥7TFlops,深度学习≥112TFlops;
– ▲≥1个100Gb/s网络适配器;
– ≥1个10Gb网口;
– ≥1个1Gb网口;
– 提供KVM-OVER-IP功能;
– ▲提供(N+N)冗余白金级热插拔电源,冗余风扇,支持热拔插
– 数量:≥4台
|
|
|
|
2.3
| 众核计算节点
| – ▲单节点配置≥1颗 64 bit x86众核处理器(FP32性能≥13.8TFlops)
– ▲单节点配置内存≥192GB (6×32GB),内存条≥32GB, DDR4 2666 MHz RDIMM;
– ▲单节点配备≥2TB SSD硬盘,硬盘支持热插拔;
– ▲≥1个100Gb/s 网络适配器
– 支持主流AI,深度学习架构体系
– ≥1个10Gb网口
– ≥1个1Gb网口
– 提供KVM-OVER-IP功能。
– 配置满足节点要求的机箱。
– ▲提供(N+N)冗余白金级热插拔电源,冗余风扇,支持热拔插
– 数量:≥4台
|
|
|
|
2.4
| FPGA计算节点
| – ▲单节点配置两路64 bit x86通用处理器 (单个处理器≥20 核, 2.4 GHz,双精度浮点运算理论峰值≥1.5TFlops, TDP≤150W );
– ▲单节点配置内存≥192GB (6*32GB或12*16GB),内存条≥16GB, DDR4 2666 MHz RDIMM;
– 单节点配备≥1TB SSD硬盘,硬盘支持热插拔;
– ▲单节点配置≥8块主流FPGA卡(单卡配置4×16GB DDR4 2133MHz内存,4个万兆接口,1.15M逻辑单元,设计功耗不超过50W,峰值功耗不超过75W,≥1.5TFlops DSP性能。集成深度学习主流IP,并提供培训);速度等级≥ 2级
– ▲≥1个100Gb/s 网络适配器
– ≥1个10Gb网口
– ≥1个1Gb网口
– 提供KVM-OVER-IP功能。
– ▲提供(N+N)冗余白金级热插拔电源,冗余风扇,支持热拔插
– 数量:≥2台
|
|
|
|
2.5
| 大内存节点技术要求
| – ▲单节点配置八路64 bit x86通用处理器,(单个处理器≥24 核, 2.1 GHz,双精度浮点运算理论峰值≥1.6TFlops, TDP≤150W);
– ▲单节点配置内存≥6TB (96*64GB),内存条≥64GB, DDR4 2666 MHz RDIMM;
– ▲单节点配备≥2×2TB SSD硬盘,硬盘支持热插拔;
– 单节点配备≥1×240GB SSD OS 硬盘,硬盘支持热插拔;
– ▲≥1个100Gb/s 网络适配器
– ≥1个10Gb网口
– ≥1个1Gb网口
– 提供KVM-OVER-IP功能。
– ▲提供(N+N)冗余白金级热插拔电源,冗余风扇,支持热拔插
– 数量:≥2台
|
|
|
|
3.1
| 高性能存储系统
| ● 主存储系统要求为稳定运行的网络并行文件系统,实现磁盘空间在整个计算机系统内的全局共享访问和数据中心一期登陆和管理节点的互访。具体要求如下:
– ▲总缓存容量≥512GB
– I/O节点(控制器) HPL理论峰值≥ 1100 GFlops
– 文件系统应提供原厂授权书和至少5年的原厂服务承诺函;
– ★★裸容量≥5.5 PB,数据保护级别不低于RAID 6, NL-SAS企业级硬盘;
– ▲持续聚合IO带宽≥40GB/s,提供存储厂商原厂测试报告;
– ▲支持对文件的并发访问,具备良好的容错和恢复功能,存储系统的任一节点宕机后,需能保证通过并行文件系统正常访问全部数据,整个系统不存在单点失效。提供详细的技术说明;
– ▲系统所配备的磁盘阵列至I/O节点(控制器)的连接需采用冗余链路,避免单点故障。控制器,磁盘阵列前后通道数量及磁盘阵列数量应满足吞吐量需要,支持磁盘热插拔和磁盘热备;
– ▲根据需要提供满足文件系统性能和可靠性要求的足量的I/O服务器及管理节点,所有节点不兼做其他用途。
– ▲南方科技大学计算中心一期项目采用Lustre文件系统和EDR Infiniband高速计算网络,需满足两套集群的登陆和管理节点互访存储系统
|
|
|
|
4.1
| 100Gb/s全线速无阻塞交换机
| – ▲100Gb/s全线速无阻塞交换机, 单交换机最大端口数≥1100, 延时不高于330ns,背板交换能力不低于230.4Tb/s
– ▲Spine板,Leaf板,电源模块,管理模块等均满配。
|
|
|
|
4.2.1
| 以太网交换机
| — 维护管理网络使用千兆以太网,接入层交换机采用千兆交换机,交换容量≥ 128Gbps,每台千兆交换机提供不少于48个千兆以太网端口,并配置不少于2个万兆上联端口。
|
|
|
|
4.2.2
| 以太交换机
| — 维护管理网络使用万兆以太网,汇聚层交换机采用万兆交换机,交换容量≥ 960Gbps,每台千兆交换机提供不少于48个万兆以太网端口,并配置不小于6个40Gb上联端口。
|
|
|
|
5.1
| 集群机柜
| – 42U标准机柜
– 提供合理的空间布局及机柜规划设计图
– 数量≥18套,高密度优先
|
|
|
|
5.2
| PDU
| – ▲PDU规格:380V/32A PDU,并配置工业连接器,支持网络管理。
– ▲数量:≥ 4个/Rack
|
|
|
|
5.3
| KVM
| – KVM规格:1U 17"液晶折叠套件以及相应的管理模块和线缆,包括控制管理模块,标准键盘、鼠标套件。满足显示所有设备需求。
– 数量:≥1套
|
|
|
|
6.1
| 集群管理软件
| – 提供监控与管理系统,实现对整机系统的管理与运行监控,具体要求如下:
– 单一管理界面,实现用户管理,包括用户账号管理、安全管理、文件管理、命令管理等;
– 准确的系统记账功能、自动生成用户账单,使用户消耗的计算资源一目了然;
– 可以直观、有效的提供各节点的系统负载、内存使用、网络流量、存储空间等各种系统资源信息;
– ▲可监控各节点硬件状态的实时信息,可提供故障报警,并能通过E-mail,短信等方式向管理员发送提醒。可远程开关节点机。监控系统基于硬件,支持多种操作系统;
– ▲支持设置CPU核时、内存使用量、磁盘使用量、GPU核时、KNM核时、FGPA核时等的费率,可按以上计算资源综合计费。
– 支持按月通过E-mail自动向用户发送账单
|
|
|
|
6.2
| 故障诊断分析系统
| ● ▲可远程收集和诊断系统故障和告警、可以集中监控查看硬件设备的状态、审计日志和预警信息,以及执行设备电源开关动作等;须提供免费升级服务。
|
|
|
|
6.3
| 操作系统
| – Red Hat Enterprise Linux 64位,主流稳定版本
|
|
|
|
6.4
| 集群作业调度系统
| ● 作业管理系统采用成熟的商业软件,以实现对计算资源与用户的高效管理。具体要求:
– 支持多种调度策略,保证大作业能够得到调度;
– ▲支持CPU,GPU,内存,KNM核,FPGA核等计算资源的统一调度和管理;
– 支持多种调度算法(抢占,回填等)。允许管理员调整任意单一作业优先级。
– ▲支持动态优先级的公平调度策略。支持自定义并行计算作业的分布运行方式,。
– ▲支持对集群内用户和应用所需计算资源的限制及配额管理;
– ▲用户监测,能监测用户在集群中的各种使用资源的行为(包括CPU,GPU,MEM,DISK,KNM,FPGA等)。
– 支持通过Email发送作业状态通知;
– 支持本集群系统中的所有MPI实现,支持OpenMP;
– 支持交互式作业,支持多队列管理,各个队列可设置不同管理策略、根据作业的运行情况动态调整用户优先级;能够对系统运行情况进行动态监视和分析,提供直观的、可视化的计算机资源(CPU利用率、内存使用情况、节点占用情况等)运行实时监控工具,并能够按日、按月提供系统资源(CPU利用率等)使用报表等。
– 支持将CPU,GPU,内存,KNM核,FPGA卡等作为计算资源,只要以上计算资源中的一项被占满时,计算节点就被作业管理系统判断为占满(不允许其它作业再往该节点上交)
– 根据作业提交核心数自动为openmp作业配置线程数,并且采用bind-to-core方式将线程绑定到CPU核心上,以免同一节点openmp作业与mpi作业互相影响。
|
|
|
|
6.5
| 开发编译环境及并行库
| ● 投标人必须提供下述并行软件开发环境,费用包含在投标总价中,具体要求如下:
– ▲提供与节点处理器相同类型的C/C++、Fortran、Java编译器,提供最新商业版处理器原厂C++/Fortran编译器和数学库;
– 提供GPU and FPGA 开发,编译配套软件
– 编译器支持OpenMP 4.5,支持多核处理器内的自动并行化与优化功能;
– 支持MPI 1.2/2.0/3.0并行标准,提供优化的MPI并行环境,并支持MPI与OpenMP的混合编程;
– 安装并调试处理器原厂,计算网络原厂和GCC版本MPI,Openmpi, MPICH等软件,并且提供与作业调度系统的衔接;
– 提供基于节点处理器结构的并行调试工具、性能分析与优化工具、线程构建和错误分析工具和MPI并行环境,支持优化的IO库;
|
|
|
|
7.1
| 精密空调
| 1. ▲参考品牌:艾默生;施耐德;西门子。
2. ▲单台额定冷量≥39kw。
3. ▲总制冷量≥500kw。
4. 行级列间空调,水平送风。
5. 规格: 2000~2200mm高;600 ~ 800mm 宽;1100~1200mm深 。
6. 空调电气性能:
1)输入电压(220/380V)波动范围≤ ±10.5%。
2)频率(50Hz)波动范围≤ ±2.5Hz。
7. 机房专用空调机组的温度、湿度控制性能:
1) 精密空调应支持自动调节室内温、湿度,具有制冷、加热、加湿、除湿等功能。
2) 温度调节范围≥ 19℃ ~ 39℃。
3) 温度调节精度≤ ±1℃。
4) 温度变化率≤ 6℃/小时。
5) 湿度调节范围≥ 20% ~ 55%RH。
6) 湿度调节精度≤ ±5%RH。
7) 温、湿度波动超限应能发出报警信号。
8. 提供标准网络接口,可接入环境监控系统。
9. 机组蒸发器应保障高效的热交换效率。
10. 空调机组应安装空气过滤器,空气过滤器应便于更换,滤网可反复清洗和更换,空气过滤器应具有脏堵检测及报警功能。
|
|
|
|
7.2
| 环境空调
| 1. ▲参考品牌:艾默生;施耐德;西门子。
2. ▲制冷显冷量≥30KW。
3. 水平送风方式。
4. 提供标准网络接口,可接入环境监控系统。
5. 机房环境空调机组的电气性能:
1) 输入电压(220/380V)波动范围≤ ±10.5%。
2) 频率(50Hz)波动范围≤ ±2.5Hz。
6. 机房环境空调机组的适应环境不低于以下条件:
温度: -9℃ ~ +29℃。
湿度:≤ 94%RH。
7. 机房环境空调机组的温度、湿度控制性能:
1) 机房环境空调应支持自动调节室内温、湿度,具有制冷、加热、加湿、除湿等功能。
2) 温度调节范围≥+18℃ ~ +27℃。
3) 温度调节精度≤ ±1℃。
4) 温度变化率 ≤ 5℃/小时。
5) 湿度调节范围≥40% ~ 60%RH。
6) 湿度调节精度≤±5 %RH。
8. 温、湿度波动超限应能发出报警信号。
|
|
|
|
7.3
| UPS
| 1. ▲参考品牌:艾默生;施耐德;西门子。
2. 总体要求:
▲UPS容量:≥600KVA。
3. UPS类型应为在线式双变换式,制式为三相输入,三相输出。
4. 投标UPS须采用IGBT高频整流、IGBT高频逆变技术。
5. UPS整流器及逆变器须采用三电平或优于三电平的高频变换技术。
6. 电气性能和环境要求:
1) 输入方式:三相四线。
2) 输入电压(380V AC)范围≥-20% ~ +25%;输入谐波电流总含量≤5%。
3) 输入额定频率50Hz/60Hz。
4) 输入频率范围≥40Hz ~ 70Hz。
5) 输入功率因数≥0.99。
7. 提供标准网络接口,可接入环境监控系统。
|
|
|
|
7.4
| UPS后备电池
| 1. ▲ 参考品牌:艾默生;山特;理士。
2. ▲ 后备延时大于30分钟, 通过现场测试作为验收标准。
|
|
|
|
|
|
|
|
|
|