序号 | 货物名称 | 招标技术要求 |
1 | 管理节点 | ▲1.1处理器:配置2颗Intel Xeon Gold 5218处理器(单个处理器≥16核/2.3GHz, TDP≤125W); |
▲1.2内存:配置内存≥192GB (6*32GB),内存条≤32GB DDR4 2993 MHz RDIMM; |
1.3硬盘:配置≥2块 2.5 英寸 1.92TB 热插拔固态硬盘 |
1.4阵列控制器:配置≥1块12Gb SAS/SATA Raid卡,带2GB可读写Flash缓存(具备缓存数据掉电保护功能),支持 Raid 0/1/5/6 |
1.5网卡:配置≥4个1Gb RJ-45网口 |
1.6 IB卡:配置≥2个100Gb InfiniBand网口 |
1.7电源:配置≥2个(1+1)冗余铂金级热插拔电源,电源输出功率≥750W |
1.8性能:要求投标服务器当前CPU配置在第三方权威测试机构(www.spec.org)的性能测试值SPECrate2017_fp_base≥181,(需提供Spec网站测试结果网页截图和网址链接证明。) |
1.9管理模块:配置服务器远程管理模块和独立远程管理网口,支持远程KVM和中文管理界面,支持移动管理APP;要求提供可支持Android或IOS的移动APP下载网址链接和网页截图。 |
▲1.10平均无故障时间:投标服务器型号通过国家级检测机构的可靠性检验,平均无故障时间MTBF可靠性指标不低于150000小时。要求提供国家级检测机构出具的检验报告或检验合格证书扫描件,原件备查 |
1.11 提供编译环境及并行库: 最新版本的Intel程序编译环境,基于64位操作系统并兼容32位系统。提供:Intel Fortran、C、C++编译器; GNU系列开发工具、含GNU Fortran、C、C++、Perl、Python等编译系统 |
1.12 提供作业调试系统: 1)支持SMP、集群、单机构成的混合异构平台,支持RISC(Power/ARM)/CISC(X86)架构CPU统一调度和管理; 2)支持作业资源使用控制,能够确保作业间不会互相侵占资源,支持的资源包括CPU,内存和GPU。 3)支持Windows 、Linux、UNIX(Solaris/AIX/HP UNIX)、Mac OS等异构操作系统,所有系统能组成一个统一集群,实现使用、管理和维护的一体化。 4)支持多种调度算法,包括回填、抢占,绝对优先级,独占等;支持基于Slot/host等资源的预约。 |
2 | 双路计算节点 | 2.1品牌要求:与管理节点同一品牌 |
2.2高密度架构:考虑到提高数据中心空间利用率和未来扩展性,要求投标服务器型号的CPU密度≥4颗/1U空间 |
▲2.3处理器:配置2颗Intel Xeon处理器 (单颗处理器≥24核, 2.4GHz); |
▲2.4内存:配置内存≥384GB (12×32GB),内存条≤32GB DDR4 2933 MHz RDIMM; |
2.5硬盘:配备≥1×480GB SATA SSD硬盘,硬盘支持热插拔; |
2.6 IB卡:配置≥1个100Gb/s InfiniBand适配器 |
2.7 Raid:支持RAID 0/1/10/5等 |
2.8网卡:配置≥2个10Gb RJ-45网口 |
▲2.9管理模块:每套机箱配置≥2个千兆RJ45独立管理端口,多套设备可以通过菊花链串接在一起,每菊花链可以连接≥5套机箱,实现单一管理界面对多个设备进行统一管理,并简化布线和节省交换机端口; 投标人须提供以下任意一种证明材料:①实际生产厂商盖章的技术规格偏离表;②实际生产厂商网站页面截图;③产品说明书扫描件;④产品彩页扫描件。证明材料应说明产品满足本项技术参数要求,未提供者视为不满足。 |
2.10电源:配置≥2个(1+1)冗余白金级热插拔电源,电源输出功率≥2000W,冗余风扇,支持热拔插 |
3 | 存储IO节点 | 3.1品牌:考虑到产品兼容性和统一运维监控管理的便利性,要求与双路计算节点同品牌 |
▲3.2处理器:配置2颗Intel Xeon Gold 5218处理器(16核/2.3GHz)或更高 |
3.3内存:单台主机配置≥12×16GB DDR4 2993MHz RDIMM; |
3.4系统盘:单台主机配置≥2块480GB SSD硬盘,硬盘支持热插拔; |
▲3.5数据盘:单台配置NVMe PCIe 3.0热插拔固态硬盘不少于8块,该固态硬盘单块性能指标要求:耐用性≥3.0 DWPD,MTBF≥2500000小时,读IOPS (4 KB blocks) ≥750000,写IOPS (4 KB blocks) ≥160000,顺序读(128 KB blocks)≥3200 MB/s, 顺序写(128 KB blocks)≥3000 MB/s;单块固态硬盘≥3.2TB |
3.6阵列控制器:配置≥1块12Gb SAS/SATA Raid卡, 带4GB可读写Flash缓存(具备缓存数据掉电保护功能),支持RAID 0/1/10/5/50 |
3.7 网卡:配置≥4个1Gb RJ-45网口 |
3.8 IB卡:单台主机配置≥2个100Gb InfiniBand网口 |
3.9 HBA卡:配置≥2块12Gb SAS HBA卡,每块≥4个外部物理SAS接口 |
3.10 电源:单台主机配置≥2个(1+1)冗余白金级热插拔电源,电源输出功率≥1100W |
3.11 性能:要求投标服务器当前CPU配置在第三方权威测试机构(www.spec.org)的性能测试值SPECrate2017_fp_base≥181,(需提供Spec网站测试结果网页截图和网址链接证明。) |
3.12 存储I/O协议:支持POSIX、NFS v4、 SMB v3.0、OpenStack Cinder(block方式)、OpenStack Swift(object方式)、 S3(object方式)等多种存储I/O协议 |
3.13存储数据分层:支持SSD缓存、支持数据自动分层,可设置灵活策略,在不同存储层间进行数据移动 |
3.14 存储数据压缩:支持在线数据自动压缩 |
3.15 信息生命周期管理:支持信息生命周期管理,可根据策略自动迁移或备份数据,简化数据管理 |
3.16 客户端支持:支持原生的Linux、windows客户端 |
3.17 客户端数据缓存与预读功能:支持在客户端内存中记录最近的I/O,减少访问磁盘的次数 |
3.18 访问模式识别以及深度预取功能:支持检测并可识别数据访问模式如顺序访问,随机访问, 模糊顺序访问(fuzzy sequential)或者步进式访问(strided),进行并行预取,减少重复性磁盘I/O以提高性能 |
3.19 小文件支持:支持海量小文件读写,每个文件系统最多 2的63次方个文件 |
3.20 高效锁机制:提供块级别的锁–字节锁(Byte range locking)功能,提高磁盘带宽和磁盘空间的效率 |
3.21 文件系统日志功能:记录所有文件系统的操作,保护文件系统数据不被失效节点或者错误状态节点所更改 |
3.22 配额和权限管理:支持用户配额管理和高级权限管理功能,支持NFS v4 ACL权限控制 |
3.23 图形化管理:支持图形化监控,包括系统资源和系统性能等,以及节点、磁盘、网卡、服务和文件系统等的运行状态或性能监控 |
4 | 高性能存储系统 | ▲4.1品牌要求:考虑到产品兼容性和统一运维监控管理的便利性,要求与存储IO节点同品牌 |
4.2体系架构:考虑到提高数据中心空间利用率和未来扩展性,要求投标产品为高密度大容量存储系统,设备高度≤4U,要求配置的存储磁盘柜硬盘密度≥15块3.5英寸硬盘/1U空间 |
4.3控制器:冗余双控制器架构,控制器为双活工作模式,控制器内配置ASIC架构专用RAID计算芯片,可支持FC、iSCSI、SAS等协议 |
▲4.4控制器缓存:存储控制器缓存配置≥128GB(不含任何性能加速模块或NAS缓存、FlashCache、PAM卡,SSD Cache等) |
▲4.5磁盘:配置≥50块8TB 7.2K SAS硬盘(或性能和总容量不低于上述要求的其他配置组合) |
4.6 磁盘扩展能力:支持扩展≥480块热插拔3.5英寸SAS硬盘,要求本次投标产品配置预留≥10个3.5英寸SAS硬盘空余槽位空间,满足未来存储容量和硬盘在线扩展 |
4.7 RAID保护:支持多种工业标准RAID存储方式混用,包括单盘失效、双盘失效保护技术,包括RAID0/1/10/5/6/及动态磁盘池(RAID⒉0)技术。支持RAID组动态扩展,在线升级等;要求存储系统支持全局动态热备技术,在配置RAID2.0时,磁盘热备功能通过磁盘剩余空间实现,无需占用单独热备盘。 |
4.8 前端主机接口:支持≥8个32Gb FC主机接口,支持≥4个10Gb iSCSI或16Gb FC通用的主机接口,本次配置≥8个12 Gb SAS x4主机接口(配置SAS线缆),≥4个10Gb iSCSI或16Gb FC通用的主机接口 |
4.9 要求iSCSI和FC主机接口支持服务器直连,不需要经过以太网交换机或FC SAN交换机互连。 |
▲4.10投标存储产品型号在存储性能理事会SPC(www.storageperformance.org)的IOPS测试值≥460000,且要求在SPC网站公布的性价比(Price-Performance)排名前五的产品,必须提供SPC网站性价比排名、测试报告截图和网址链接证明 |
4.11 数据保护功能:提供≥1024个快照和卷克隆功能 |
4.12 配置中文图形化存储管理软件,对存储系统的各项指标进行管理、调整和监测 |
4.13 配置冗余电源、冗余风扇、冗余控制器,支持在线可热插拔更换,保证系统内无任何单点错误的隐患 |
4.14支持硬件集中式资源管理系统,可简化基础结构管理、加快响应和提高硬件系统可用性,可自动发现、清点、跟踪、监控和管理本项投标的服务器和存储系统等硬件设备,实现数据中心硬件设备的统一运维管理 |
4.15高性能存储总体性能指标:基于本项目投标存储系统的硬件配置,总读/写带宽:≥20GB/s(采用IOZONE测试,测试文件大小需≥所有测试节点和控制器节点内存总和的2倍; |
4.16高性能存储单流性能指标:基于本项目投标存储系统的硬件配置,单节点单线程实测顺序读/写带宽:≥4GB/s(采用IOZONE测试,测试文件大小需≥所有测试节点和控制器节点内存总和的2倍)。 |
5 | 计算网络 | ▲5.1 端口配置:配置≥36口EDR 100Gb/s Infiniband计算网络 |
5.2 电源风扇冗余:配置冗余热插拔电源和风扇 |
5.3 网络兼容性支持:兼容FDR,EDR,以便未来扩展 |
5.4 Infiniband规范:符合IBTA 规范1.3 和1.21 |
5.5 Infiniband线缆:配置满足互连要求的交换机原厂100Gb Infiniband线缆,长度根据实际需求配置 |
6 | 集群管理软件 | ▲6.1 需包含集群部署、集群管理、集群监控、作业调度、计费、告警、用户管理等模块 |
6.2支持B/S Web架构。支持中英文切换 |
6.3支持集群公告的发布 支持集群的自定义名字 Web页面上批量开关机 web 页面上打开web ssh来访问节点 Web页面上打开web console来访问节点 支持并行shell和并行拷贝:psh,pscp Web页面支持vnc session的管理,可以查看vncsession和删除vncsession |
6.4(1)提供全方位完整的系统监控功能,实时监控显示集群作业、队列、网络,存储、内存、CPU等使用状态,显示作业量历史趋势,实时显示集群节点的忙闲状况 (2)监控指标:系统负载,CPU使用率,内存使用率,硬盘使用率,节点温度,节点能耗,网络吞吐,作业信息等。 (3)提供多种不同视图的监控方式: a.物理视图:支持机房/机柜的物理视图显示,展示机器设备的实际机房位置。物理视图中可实时显示该位置设备的负载情况和系统功耗,并有历史记录。可将不同Rack间的监控指标进行对比,并生成直观的3D图。 b.分组视图:可以设置节点角色,并根据相同特征分组查看并监控。 |
6.5(1)能对系统所设置的特定事件进行告警,如各种硬件故障、软件故障、温度过高等。 (2)支持手动策略定制。 (3)支持微信、短信、邮件、web页面等告警方式。 (4)支持批量操作。 |
▲6.6能对集群的各种操作日志和使用情况生成报表: (1)支持集群操作日志报表 (2)节点运行状态报表 (3)节点联机用户报表 (4)用户连接时间报表 (5)告警统计报表 (6)作业详细报表 (7)支持报表定制功能 |
6.7支持本地账户/NIS/LDAP/Windows AD域等 (1)所有HPC软件接口直接向用户开放,用户可以非 (2)常方便的要求定制或进行二次开发 (3)支持方便的在已有的集群上搭建Web界面。 (4)支持作业模板的定制化,支持报表的定制化,支持3D机房的定制化 |
6.8提供集群Linpack测试报告,本次采购设备中计算节点整体效率要求不低于63%(以Base频率计算) |
7 | 运维管理系统 | 7.1可对云主机、云盘、本地高性能系统、异地高性能系统进行统一管理;支持对不具备公网IP的云主机、局域网主机进行远程访问的能力 |
7.2 (1)可对局域网主机的CPU、内存、网络(包括内网及公网)、系统磁盘I/O、磁盘使用率、系统进程等多个资源项进行监控,并可自定义告警阈值; (2)支持对象存储服务监控,监控内容包括:存储用量、存储文件结构、热点访问数据、出站流量、请求次数、HttpCode请求返回码等,可提供近30天的历史监控数据查询,可根据访问流量设定预警阈值; (3)当监控项触发预警阈值时,可通过手机微信接收预警通知,并通过微信查看告警详情。 |
7.3 (1)支持对局域网主机进行文件的上传、下载、复制、移动等操作,便于进行统一分发和升级; (2)可提供基于团队的文件共享,以实现团队成员间的文件共享与传递,便于进行实验数据共享 |
7.4 (1)可对主机操作系统的登录行为进行检测,对异常登录行为进行记录统计并处理; (2)可根据当前负载情况,对CPU、内存、硬盘等资源的开销进行负载趋势预测 (3)支持一键体检,可以图表结合的形式自动生成体检报告,可定时推送至微信。 (4)可根据云资源的压力负载、配置情况、成本支出等进行综合分析,自动生成优化建议 |
7.5管理员可设置强制对用户操作进行录像,所有操作行为均进行录像审计 |
▲7.6会话的创建者可将会话同时分享给多个用户; |
7.7可使当前会话驻留在服务器上,在用户关闭本机访问客户端后会话依然保留,用户再次登录平台后可打开已保留的会话.提供软件功能截图证明 |
7.8 (1)支持脚本/命令批量执行,在同一个页面展示所有执行结果; (2)支持将指定文件批量发送至多台主机,或将分散在大量主机上的某类文件收集到指定位置; (3)支持将复杂的作业节点编排成任务,设定触发条件和时间,只需设置好执行的时间和业务节点,自动执行,无需人工干预。 |
8 | MDC一体化机柜 | 8.1供配电一体化柜应包含柜体、供配电模块、制冷模块、监控采集器、触摸屏、消防组件、声光告警灯等。 |
▲8.2柜体、供配电、制冷模块、监控采集器应品牌一致。 |
8.3柜体: 柜体技术规范要求如下: 宽度600mm,高度2000mm,深度≤1400mm。前后门均应为玻璃门,不得采用钣金门; 前玻璃门应镶嵌系统级触摸屏,触摸屏尺寸≥9吋。 柜内应整合系统输入输出配电屏,包含市电总输入空开、智能电表、供配电各自独立的主路输入空开/旁路输入空开及输出空开、维修旁路空开、空调空开、IT配电空开、照明空开、应急风扇空开; 柜体前部应配备吸风应急风扇,后部应配备排风应急风扇; 柜内应配备不少于4个温度传感器和2个温湿度传感器,均匀放置于柜内前后部的上、中、下处,用于全面、精细地感知柜内微环境; |
▲8.4 供配电:不少于30 kVA 后续供电主机, 支持机架式安装,高度≤8U; 标配主路输入空开、旁路输入空、输出空开、维修旁路空开; 满载输入电压范围304~475VAC(L-L); 输出功率因数≥0.9; |
8.5监控采集器: 应采用B/S架构,内置Web Server功能,用户应可通过任意一台联网PC的Web浏览器(包括Chrome、Firefox、Safari、IE、Edge等主流浏览器)访问动环采集器,实现对微模块的远程管控; 应采用双网卡设计;同时,监控采集器应采用双电源设计,以提升供电可靠性; |
8.6触摸屏: 微模块布局图应展示系统冷热通道动态气流;在布局图中的供配电一体化柜图形上显示市电输入总功率和市电三相电压,在各机柜图形上显示进风温湿度/出风温湿度;若机柜进出风温度超过设定阈值,布局图中的机柜图形应改变颜色以示告警;触摸点击任意柜体,可进入关联页面。 |
▲8.7消防组件:支持机架式安装,高度≤6U; 应集成消防控制器、温度传感器*2(前后各1路)、烟雾探测器*2(前后各1路)、七氟丙烷储罐、状态指示灯、声光告警、干接点信号输出(电源故障/火警/故障/喷放)、后备电池和机架安装组件; |
8.8制冷模块应包含行间空调(2套)、封闭框组件、带式水浸传感器 |
8.9空调柜宽度300mm,高度2000mm,整体深度与供配电一体化柜齐平 |
8.10空调柜前后门均应为全封闭钣金门,与内部行间空调前送冷风、后回热风的方式相结合,形成冷热通道均密封且互相隔离的效果。 |
8. 11空调柜颜色为RAL7021,表面喷涂采用粗桔纹。 |
▲8.12行间空调: (1)采用EC变容量压缩机,额定制冷量≥12.5kW(回风温度37℃),应支持在20%~100%冷量范围内按需柔性制冷; (2)采用EC风机,最大风量≥3000m3/h,风机数量≥4个,在行间空调正面高度方向均匀分布,水平前部送风背部回风。为保障微模块内气流循环的持续性,风机应采用冗余设计; (3)能效比≥4.0(回风温度37℃,冷凝温度45℃); (4)温度调节精度: ±1℃ ,温度变化率<5℃/小时; (5)应采用环保制冷剂R410A或R407C; (6)冷凝器工作环境温度范围不小于-15℃~+45℃; |
8.13包含2台600mm宽机柜 |
8.14每机柜包含柜体(含柜内气流管理组件、理线组件、传感器等)和两条PDU |
8.15柜体: (1)宽度600mm/高度2000mm,深度与供配电一体化柜齐平。为保证通透可视性,前后门均应为玻璃门,不得采用钣金门; (2)柜体前部应配备吸风应急风扇,后部应配备排风应急风扇; (3)柜体后部左右两侧应各配备1条竖直理线板; (4)每柜内应配备不少于4个温度传感器和2个温湿度传感器,均匀放置于柜内前后部的上、中、下处,用于全面、精细地监测柜内微环境; |
8.16 PDU: (1)竖直安装(0U),额定电流32A (2)每PDU插座规格及数量不少于21*C13(10A,IEC320)、3*C19(16A,IEC320); (3)支持插座顺序延时启动,以避免负载设备同时上电对UPS |
8.17 供配电配套柜 (1)宽度600mm,高度2000mm,深度与供配电一体化柜齐平。前后门均应为全封闭钣金门; (2)柜体靠内侧板(与微模块并柜一侧),其前部下方应设有进风栅格;侧板后部上方应设有排热风扇,可将柜内电池因充放电产生的热量导出并汇聚入微模块后部热通道中。 (3)柜内应配备温度传感器以实时监测电池组温度,并设置过温阈值,一旦柜内温度超过阈值,排热风扇应自动开启; (4)应随柜体提供电池组连接电缆和电池直流空开。 电池组容量应满足为20kW负载提供不少于15min后备时间的要求。 (a)每节电池标称电压为12V,内部由6个2V电芯串联组合而成; (b)同组电池内阻偏差应不超过15%; (c)安全阀应具有自动开启和自动关闭的功能; |
9 | HPC实施服务 | 提供硬件上架安装、HPC软件安装与调试服务 |
10 | 配套设施实施服务 | 提供机房配套设施的安装与调试,提供机房地板承重与加固,安装防静电地板,提供强电的接入,提供排水改造。 |