广西大学2022年12月政府采购意向-高性能计算机系统
广西大学2022年12月政府采购意向-高性能计算机系统
序号 | 采购项目名称 | 采购需求概况 | 预算金额(万元) | 预计采购时间(填写到月) | 备注 |
---|---|---|---|---|---|
1 | 高性能计算机系统 | 1套。总体性能指标 核心数:4,112C;内存:19,968GB;算力:双精度浮点峰值 171 Tflops;存储容量:6,120TB,可用4,400TB;IO带宽:300Gb/s 计算节点:30个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥2颗x86架构处理器,总核心数≥128,主频≥2.45GHz,支持超频、超线程技术; 3.内存:配置≥512GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD,配置RAID1;板载支持≥8个U.2 NVMe SSD; 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.扩展插槽:支持≥10个PCI-E 4.0插槽(2个内置专用插槽); 11.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 12.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 13.监控管理:支持原厂商服务器管理系统,可实现基于my-sql数据库的历史数据查询,基于B/S架构的模块化、一体化的服务器综合管理软件,实现硬件监控、管理部署、统一告警、资产管理、统计报表决策等功能; 14.服务:提供5年原厂整机质保,5年原厂免费上门服务。 胖节点:2个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥2颗x86架构处理器,总核心数≥128,主频≥2.45GHz,支持超频、超线程技术; 3.内存:配置≥2048GB DDR4 3200MHz内存,单根内存容量≥64GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.扩展插槽:支持≥10个PCI-E 4.0插槽(2个内置专用插槽); 11.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 12.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 13. 监控管理:支持原厂商服务器管理系统,可实现基于my-sql数据库的历史数据查询,基于B/S架构的模块化、一体化的服务器综合管理软件,实现硬件监控、管理部署、统一告警、资产管理、统计报表决策等功能; 14.服务:提供5年原厂整机质保,5年原厂免费上门服务。 GPU节点:1个节点 1.机型:机架式服务器,高度不超过4U,配置上架导轨; 2.★CPU:配置≥2颗x86架构处理器,总核心数≥16核,每颗CPU基准主频≥3.6GHz,支持超频、超线程技术; 3.内存:配置≥512G DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽,最大可支持4TB内存容量,支持内存ECC保护、内存镜像、内存热备,最大可支持16根数据中心级持久内存(DCPMM); 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;支持≥24个3.5寸热插拔硬盘,可支持SAS/SATA硬盘、SSD混插,支持≥16个NVMe U.2 SSD; 6.M.2:支持主板板载2个M.2接口,外插支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.扩展插槽:支持≥23个PCIe4.0插槽,支持≥20个PCIe 4.0 x16全高全长插槽;支持≥8块双宽或≥20块单宽GPU加速卡,全部GPU卡必须安装在同一个服务器GPU主板(非多计算节点堆叠方式); 9.GPU卡:配置≥2块NVIDIA 4090 双宽 GPU卡;支持扩容HG DCU双宽GPU卡;为满足不同场景下使用达到最优性能,GPU的PCIe 连接拓扑支持调整为CPU:GPU=1:4或者CPU:GPU=1:8; 10.电源:配置热插拔铂金2+2冗余电源,单电源功率≥2000W; 11.安全:支持机箱防入侵功能; 12.售后服务:提供5年原厂质保,5年免费上门服务。 管理登录节点-备份功能:1个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥1颗x86架构处理器,总核心数≥32,主频≥2.6GHz,支持超频、超线程技术; 3.内存:配置≥256GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥4GB Cache SAS 8口RAID卡; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD; 配置≥12块18TB 3.5寸7.2K 6Gb SATA硬盘;后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 11.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 12.操作系统加固模块:支持服务器操作系统加固模块,支持内核级文件、注册表、进程强制访问控制,应用授权控制,网络级访问控制,操作系统环境设置监控,可控制外接的USB设备及控制设备的端口。实现内核封装和内核隐藏,保护系统自身进程不被异常终止、伪造、信息注入。适用于Windows/Linux/Solaris/HP-UX/AIX等操作系统,包括中标麒麟Linux。 13.服务:提供5年原厂整机质保,5年原厂免费上门服务。 管理登录节点:1个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥1颗x86架构处理器,总核心数≥32,主频≥2.6GHz,支持超频、超线程技术; 3.内存:配置≥256GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥4GB Cache SAS 8口RAID卡; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;配置≥12块3.84T 2.5 SATA 6Gb R SSD硬盘,后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 11.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 12.操作系统加固模块:支持服务器操作系统加固模块,支持内核级文件、注册表、进程强制访问控制,应用授权控制,网络级访问控制,操作系统环境设置监控,可控制外接的USB设备及控制设备的端口。实现内核封装和内核隐藏,保护系统自身进程不被异常终止、伪造、信息注入。适用于Windows/Linux/Solaris/HP-UX/AIX等操作系统,包括中标麒麟Linux。 13.服务:提供5年原厂整机质保,5年原厂免费上门服务。 中转服务器:1个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥1颗x86架构处理器,总核心数≥32,主频≥2.6GHz,支持超频、超线程技术; 3.内存:配置≥64GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥2块双口1G RJ45网卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 11.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 12.服务:提供5年原厂整机质保,5年原厂免费上门服务。 分布式存储:1套 1.★产品自研能力:具有完全自主知识产权,非OEM产品,非基于Ceph、GlusterFS等开源架构开发的存储系统; 2.★产品架构:采用Scale-Out分布式集群存储架构,支持全局单一文件系统和统一命名空间,不接受IO节点+扩展柜或JBOD的模式采用全冗余架构,无单点故障,支持多种网络类型,包括1GbE、10GbE、25GbE、100Gb Infiniband等,支持NVDIMM掉电保护机制,存储整系统掉电后,数据无丢失; 3.★产品硬件:4U机架式存储节点≥10个,每个节点配置≥1颗x86架构CPU,核心数≥24,主频≥2.0GHz,支持超频、超线程技术;每节点配置≥2块960G 2.5 SATA 6Gb R SSD系统盘(RAID1),配置≥1块1.92TB NVME 2.5寸U.2 SSD(元数据盘),配置≥1块3.84TB NVME 2.5寸U.2 SSD(缓存盘)配置≥34块18TB 3.5寸 SATA硬盘(数据盘); 4.数据可靠性:支持2~4副本,N+M EC数据保护方式,最大支持任意4个数据控制器或4块磁盘同事失效,空间利用率最高可达94%,支持磁盘分组、节点分区等技术,缩小故障域,近一步保障数据安全,支持磁盘、节点、机柜级冗余,硬盘或节点失效可自动触发数据重构,重构过程无需管理员干预,可调整数据恢复优先级,系统盘采用硬RAID1,系统关键部件例如系统风扇、电源模块等支持冗余; 5.系统功能:支持文件系统、目录、用户、用户组配额,支持针对容量、文件数设置统计配额、限制配额,可配置NIS、Microsoft Active Directory、LDAP、ACL访问管理权限;存储节点的NAS连接支持基于连接数、轮询、带宽、CPU使用率等方式的负载均衡;配置SSD作为二级缓存,加速数据访问请求,支持基于目录QoS功能,可设置目录承载的最大带宽及IOPS,保证关键业务的性能资源;支持WORM(一次写入,多次读取,不可修改)功能,使文件在设定的保护期内不可被随意篡改和删除;支持数据回收站功能,远程复制,基于目录级异步复制,支持1对1复制、1对多复制、多对1复制、双向复制;支持Failover、Failback,实现远程容灾备份; 6.运维管理:提供对存储整机、所有类型磁盘、网络接口、电源模块等部件的视图级监控,故障位置需与实际保持一致,主动预测硬盘故障,自动纠错处理,可主动对慢盘进行隔离,支持SSD磨损均衡;支持集中式配置与部署,在WEB界面可实现存储系统在线升级,对系统以及各个节点资源、状态以及性能等信息进行查询,本地存储系统支持部署IO可视化分析工具,提供IO读写分布统计、IO块大小统计、随机程度统计、客户端带宽IOPS、独立缓存节点特性等分析等,支持对存储系统的状态异常进行告警,支持界面显示、Email、短信、SNMP等方式展示和通知; 7.扩展能力:单个存储系统可扩展到≥4096个存储节点;单系统容量支持≥500PB; 8.部署方式及协议支持:元数据节点和数据节点既支持全对称部署方式,也支持非对称架构部署方式;Linux系统可以直接通过POSIX接口访问存储系统;统一资源池支持同时提供NFS、CIFS、FTP、POSIX、S3等接口,无需配置第三方共享软件,无需二次导出,POSIX接口数据共享访问延迟≤10ms; 9.快照功能:支持文件/目录级快照,存储系统支持快照≥20000;存储系统的Web界面可实现快照的回滚; 10.分级存储功能:支持分级存储,基于既定策略将文件迁移到特定存储介质上。分级策略包括文件名、文件大小、修改时间、访问时间、元数据修改时间进行数据迁移; 11.存储集群管理:提供GUI管理界面,支持运维可视化,无需第三方软件或插件,即可支持同一Web界面管理多套存储集群; 12.服务:提供原厂5年质保,5年免费上门服务。 计算网络:1套 1.★IB交换机配置:提供≥1台Infiniband交换机,单台交换机要求≥40个200Gb HDR Infiniband接口,冗余电源模块; 2.千兆接口数量:提供≥2台三层千兆交换机,单台交换机要求≥48个10/100/1000M自适应电口,冗余电源模块; 3.线缆:配置项目所需线缆,并要求线缆长度满足安装要求。 4.服务:提供5年质保,5年免费上门服务。 集群管理调度系统:1套 1.★总体要求:国产自主创新品牌,成熟的商业软件套装产品; 2.★许可:配置满足此次项目所需所有许可; 3.软件架构:基于B/S架构实现,支持主流浏览器(IE、Firefox、Chrome),支持移动设备(如iPhone,Android)访问; 4.API接口:要提供开发接口API及文档,允许在该套系统基础上做二次开发; 5.服务高可用:支持管理节点的双机热备,主节点出问题,备用节点自动接管并继续提供服务; 6.跨平台:支持跨操作系统平台(windows,linux)进行监控管理; 7.物理视图:提供直观的物理视图,如实展现机柜、服务器等设备的物理分布和相对位置关系;支持远程开关机等操作;直观的展现各类设备的告警信息;提供服务器详细状态监控视图,分类展示该节点的静态信息和运行状态。静态配置信息包括CPU型号、内存大小、管理IP、操作系统版本等,动态信息包括磁盘分区状态、网卡状态、进程状态、IPMI传感器状态、GPU/MIC状态等。支持iKVM远程管理; 8.服务器热图:支持热图方式集中展现集群中所有服务器的关键指标,如CPU利用率、内存利用率、网络可用性、电源状态、温度等,支持指标快速切换; 9.状态分析视图:提供调度系统状态分析视图Dashboard,直观展示集群、队列、用户等不同视角的资源使用信息和作业负载信息,为管理员的调整优化提供决策依据; 10.数据分析:支持节点健康度按照(关机时间,管理网不可用,告警数量)进行统计分析; 节点用量统计分析(相对一分钟负载,内存利用率,磁盘利用率,磁盘增长量,功耗); 11.网络监控:支持IB/以太网的网络监控与端口流量分析; 12.监控首页:支持集群负载,集群功耗,健康度,共享存储等统计分析; 13.告警策略:支持自定义告警策略,实现页面预警、邮件告警等通知方式;符合告警策略条件将会产生相应告警信息并通过邮件、短信方式通知负责人; 14.报表指标:提供丰富的服务器(或服务器组)报表指标,包括CPU平均利用率、内存使用率、内存使用量/剩余量、磁盘(或磁盘分区)使用率、磁盘(或磁盘分区)使用量/剩余量、网卡接收/发送速率、磁盘读写速率等; 提供丰富的交换机报表指标,包括交换机内存、交换机CPU/内存利用率、交换机端口输入流/输出流、交换机输入错误率/丢失率、交换机输出错误率/丢失率等; 15.报表预定义:支持将所选参数保存为预定义报表,双击即可生成报表,方便后续使用; 16.一键配置集群:提供灵活强大的集群配置能力,可以一键完成对整个集群的检测和配置,如检测网络可用性、配置ssh/rsh无密码登*、停止系统冗余服务、配置NFS、同步集群时间、同步集群用户等。管理员可以灵活组合不同的配置项; 17.用户管理:支持对平台用户数据库用户和各类操作系统用户(如本地用户、NIS、LDAP等)的统一管理,支持用户的创建、修改、删除、冻结和激活操作; 18.大规模多指标监控:支持大规模监控管理,系统采集节点规模支持50000+节点,采集指标数量1000+种,采集秒级反馈,查询秒级响应; 19.webshell:支持图形化集成命令行窗口; 20.通知消息管理:提供消息管理功能,允许管理员查询或者删除平台使用过程中产生的各类通知消息,如作业通知消息、申请/审批消息、故障单提交/处理消息; 21.应用Portal:提供所有常见高性能应用的作业提交Portal,整合文件管理、VNC等功能,有效降低工程应用人员使用HPC集群的门槛; 22.队列管理:支持基于Web的队列管理,各队列可设置不同的资源配额、访问策略和调度策略; 23.调度策略:支持基于队列、用户、用户组等多个维度的优先级定义策略,根据作业的静态(如资源请求、所属用户等)和动态指标(如入队时间、公平共享份额等),通过不同的权重设置,灵活控制作业优先级;支持作业回填,有效平衡大作业和小作业的调度,提高集群作业吞吐量,支持作业多级抢占,支持对被抢占作业进行“挂起”、“重新入队”等处理操作; 24.用户资源配置:支持基于Web的用户管理,设置不同用户的用户类型、用户优先级、资源配额、可访问队列等; 25.预付费支持:支持计费账号管理,允许多个用户使用一个计费账号;支持通过“先充值后扣费”方式使用集群资源,只有账号余额充足时才能运行作业; 26.多视角统计:支持从用户、队列、节点、应用、账号、作业规模等不同角度进行统计计费; 27.多视角统计:支持基于CPU、GPU、存储空间计费; 28.计费详表:支持导出作业粒度的计费详表,供用户核对;支持GPU、存储计费; 29.大规模:支持大批量作业的实时调度,支持最大瞬时大规模作业(超过3000+个)的同时提交,支持大批量作业的动态优先级调动并发瞬时吞吐率峰值(2000+个),支持15000节点的资源调度; 30.高性能计算在线运维模块:提供1年高性能计算集群在线运维服务,本次提供商业版成熟的远程运维服务模块,支持7*24小时远程运维监控、运维管理的工作, | 600.0000 | 2023年02月 |
序号 | 采购项目名称 | 采购需求概况 | 预算金额(万元) | 预计采购时间(填写到月) | 备注 |
---|---|---|---|---|---|
1 | 高性能计算机系统 | 1套。总体性能指标 核心数:4,112C;内存:19,968GB;算力:双精度浮点峰值 171 Tflops;存储容量:6,120TB,可用4,400TB;IO带宽:300Gb/s 计算节点:30个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥2颗x86架构处理器,总核心数≥128,主频≥2.45GHz,支持超频、超线程技术; 3.内存:配置≥512GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD,配置RAID1;板载支持≥8个U.2 NVMe SSD; 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.扩展插槽:支持≥10个PCI-E 4.0插槽(2个内置专用插槽); 11.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 12.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 13.监控管理:支持原厂商服务器管理系统,可实现基于my-sql数据库的历史数据查询,基于B/S架构的模块化、一体化的服务器综合管理软件,实现硬件监控、管理部署、统一告警、资产管理、统计报表决策等功能; 14.服务:提供5年原厂整机质保,5年原厂免费上门服务。 胖节点:2个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥2颗x86架构处理器,总核心数≥128,主频≥2.45GHz,支持超频、超线程技术; 3.内存:配置≥2048GB DDR4 3200MHz内存,单根内存容量≥64GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.扩展插槽:支持≥10个PCI-E 4.0插槽(2个内置专用插槽); 11.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 12.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 13. 监控管理:支持原厂商服务器管理系统,可实现基于my-sql数据库的历史数据查询,基于B/S架构的模块化、一体化的服务器综合管理软件,实现硬件监控、管理部署、统一告警、资产管理、统计报表决策等功能; 14.服务:提供5年原厂整机质保,5年原厂免费上门服务。 GPU节点:1个节点 1.机型:机架式服务器,高度不超过4U,配置上架导轨; 2.★CPU:配置≥2颗x86架构处理器,总核心数≥16核,每颗CPU基准主频≥3.6GHz,支持超频、超线程技术; 3.内存:配置≥512G DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽,最大可支持4TB内存容量,支持内存ECC保护、内存镜像、内存热备,最大可支持16根数据中心级持久内存(DCPMM); 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;支持≥24个3.5寸热插拔硬盘,可支持SAS/SATA硬盘、SSD混插,支持≥16个NVMe U.2 SSD; 6.M.2:支持主板板载2个M.2接口,外插支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.扩展插槽:支持≥23个PCIe4.0插槽,支持≥20个PCIe 4.0 x16全高全长插槽;支持≥8块双宽或≥20块单宽GPU加速卡,全部GPU卡必须安装在同一个服务器GPU主板(非多计算节点堆叠方式); 9.GPU卡:配置≥2块NVIDIA 4090 双宽 GPU卡;支持扩容HG DCU双宽GPU卡;为满足不同场景下使用达到最优性能,GPU的PCIe 连接拓扑支持调整为CPU:GPU=1:4或者CPU:GPU=1:8; 10.电源:配置热插拔铂金2+2冗余电源,单电源功率≥2000W; 11.安全:支持机箱防入侵功能; 12.售后服务:提供5年原厂质保,5年免费上门服务。 管理登录节点-备份功能:1个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥1颗x86架构处理器,总核心数≥32,主频≥2.6GHz,支持超频、超线程技术; 3.内存:配置≥256GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥4GB Cache SAS 8口RAID卡; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD; 配置≥12块18TB 3.5寸7.2K 6Gb SATA硬盘;后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 11.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 12.操作系统加固模块:支持服务器操作系统加固模块,支持内核级文件、注册表、进程强制访问控制,应用授权控制,网络级访问控制,操作系统环境设置监控,可控制外接的USB设备及控制设备的端口。实现内核封装和内核隐藏,保护系统自身进程不被异常终止、伪造、信息注入。适用于Windows/Linux/Solaris/HP-UX/AIX等操作系统,包括中标麒麟Linux。 13.服务:提供5年原厂整机质保,5年原厂免费上门服务。 管理登录节点:1个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥1颗x86架构处理器,总核心数≥32,主频≥2.6GHz,支持超频、超线程技术; 3.内存:配置≥256GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥4GB Cache SAS 8口RAID卡; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;配置≥12块3.84T 2.5 SATA 6Gb R SSD硬盘,后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥1块双口1G RJ45网卡,配置≥1块单端口100G HDR HCA卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 11.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 12.操作系统加固模块:支持服务器操作系统加固模块,支持内核级文件、注册表、进程强制访问控制,应用授权控制,网络级访问控制,操作系统环境设置监控,可控制外接的USB设备及控制设备的端口。实现内核封装和内核隐藏,保护系统自身进程不被异常终止、伪造、信息注入。适用于Windows/Linux/Solaris/HP-UX/AIX等操作系统,包括中标麒麟Linux。 13.服务:提供5年原厂整机质保,5年原厂免费上门服务。 中转服务器:1个节点 1.机型:机架式服务器,高度不超过2U,配置上架导轨; 2.★CPU:配置≥1颗x86架构处理器,总核心数≥32,主频≥2.6GHz,支持超频、超线程技术; 3.内存:配置≥64GB DDR4 3200MHz内存,单根内存容量≥32GB;配置≥32个内存插槽; 4.硬盘控制器:配置≥1张8口SAS卡,支持Raid0/1/10; 5.硬盘:配置≥2块960G 2.5 SATA 6Gb R SSD;后置支持≥4个2.5寸硬盘,支持anybay(同时支持SAS/SATA/NVMe混插); 6.M.2:主板支持板载2个M.2接口,支持2个SATA M.2,组硬RAID; 7.网卡:配置≥2块双口1G RJ45网卡; 8.电源:配置热插拔铂金1+1冗余电源; 9.风扇:配置冗余热插拔高速系统风扇; 10.BMC:集成系统管理芯片,支持黑匣子日志、故障截屏、开机自检代码;BMC记录此次及上次开机Port80代码;BMC监控CPU、内存、HDD、PCIE设备和风扇功耗,通过BMC WEB设定整机功耗封顶值,当实际功耗超过封顶值,自动对CPU做降功耗处理从而实现整机功耗刹车功能; 11.安全:支持TCM\\TPM安全模块,用户可以设定想要阻止访问BMC的黑名单,或者设定允许访问BMC的白名单,提升安全性; 12.服务:提供5年原厂整机质保,5年原厂免费上门服务。 分布式存储:1套 1.★产品自研能力:具有完全自主知识产权,非OEM产品,非基于Ceph、GlusterFS等开源架构开发的存储系统; 2.★产品架构:采用Scale-Out分布式集群存储架构,支持全局单一文件系统和统一命名空间,不接受IO节点+扩展柜或JBOD的模式采用全冗余架构,无单点故障,支持多种网络类型,包括1GbE、10GbE、25GbE、100Gb Infiniband等,支持NVDIMM掉电保护机制,存储整系统掉电后,数据无丢失; 3.★产品硬件:4U机架式存储节点≥10个,每个节点配置≥1颗x86架构CPU,核心数≥24,主频≥2.0GHz,支持超频、超线程技术;每节点配置≥2块960G 2.5 SATA 6Gb R SSD系统盘(RAID1),配置≥1块1.92TB NVME 2.5寸U.2 SSD(元数据盘),配置≥1块3.84TB NVME 2.5寸U.2 SSD(缓存盘)配置≥34块18TB 3.5寸 SATA硬盘(数据盘); 4.数据可靠性:支持2~4副本,N+M EC数据保护方式,最大支持任意4个数据控制器或4块磁盘同事失效,空间利用率最高可达94%,支持磁盘分组、节点分区等技术,缩小故障域,近一步保障数据安全,支持磁盘、节点、机柜级冗余,硬盘或节点失效可自动触发数据重构,重构过程无需管理员干预,可调整数据恢复优先级,系统盘采用硬RAID1,系统关键部件例如系统风扇、电源模块等支持冗余; 5.系统功能:支持文件系统、目录、用户、用户组配额,支持针对容量、文件数设置统计配额、限制配额,可配置NIS、Microsoft Active Directory、LDAP、ACL访问管理权限;存储节点的NAS连接支持基于连接数、轮询、带宽、CPU使用率等方式的负载均衡;配置SSD作为二级缓存,加速数据访问请求,支持基于目录QoS功能,可设置目录承载的最大带宽及IOPS,保证关键业务的性能资源;支持WORM(一次写入,多次读取,不可修改)功能,使文件在设定的保护期内不可被随意篡改和删除;支持数据回收站功能,远程复制,基于目录级异步复制,支持1对1复制、1对多复制、多对1复制、双向复制;支持Failover、Failback,实现远程容灾备份; 6.运维管理:提供对存储整机、所有类型磁盘、网络接口、电源模块等部件的视图级监控,故障位置需与实际保持一致,主动预测硬盘故障,自动纠错处理,可主动对慢盘进行隔离,支持SSD磨损均衡;支持集中式配置与部署,在WEB界面可实现存储系统在线升级,对系统以及各个节点资源、状态以及性能等信息进行查询,本地存储系统支持部署IO可视化分析工具,提供IO读写分布统计、IO块大小统计、随机程度统计、客户端带宽IOPS、独立缓存节点特性等分析等,支持对存储系统的状态异常进行告警,支持界面显示、Email、短信、SNMP等方式展示和通知; 7.扩展能力:单个存储系统可扩展到≥4096个存储节点;单系统容量支持≥500PB; 8.部署方式及协议支持:元数据节点和数据节点既支持全对称部署方式,也支持非对称架构部署方式;Linux系统可以直接通过POSIX接口访问存储系统;统一资源池支持同时提供NFS、CIFS、FTP、POSIX、S3等接口,无需配置第三方共享软件,无需二次导出,POSIX接口数据共享访问延迟≤10ms; 9.快照功能:支持文件/目录级快照,存储系统支持快照≥20000;存储系统的Web界面可实现快照的回滚; 10.分级存储功能:支持分级存储,基于既定策略将文件迁移到特定存储介质上。分级策略包括文件名、文件大小、修改时间、访问时间、元数据修改时间进行数据迁移; 11.存储集群管理:提供GUI管理界面,支持运维可视化,无需第三方软件或插件,即可支持同一Web界面管理多套存储集群; 12.服务:提供原厂5年质保,5年免费上门服务。 计算网络:1套 1.★IB交换机配置:提供≥1台Infiniband交换机,单台交换机要求≥40个200Gb HDR Infiniband接口,冗余电源模块; 2.千兆接口数量:提供≥2台三层千兆交换机,单台交换机要求≥48个10/100/1000M自适应电口,冗余电源模块; 3.线缆:配置项目所需线缆,并要求线缆长度满足安装要求。 4.服务:提供5年质保,5年免费上门服务。 集群管理调度系统:1套 1.★总体要求:国产自主创新品牌,成熟的商业软件套装产品; 2.★许可:配置满足此次项目所需所有许可; 3.软件架构:基于B/S架构实现,支持主流浏览器(IE、Firefox、Chrome),支持移动设备(如iPhone,Android)访问; 4.API接口:要提供开发接口API及文档,允许在该套系统基础上做二次开发; 5.服务高可用:支持管理节点的双机热备,主节点出问题,备用节点自动接管并继续提供服务; 6.跨平台:支持跨操作系统平台(windows,linux)进行监控管理; 7.物理视图:提供直观的物理视图,如实展现机柜、服务器等设备的物理分布和相对位置关系;支持远程开关机等操作;直观的展现各类设备的告警信息;提供服务器详细状态监控视图,分类展示该节点的静态信息和运行状态。静态配置信息包括CPU型号、内存大小、管理IP、操作系统版本等,动态信息包括磁盘分区状态、网卡状态、进程状态、IPMI传感器状态、GPU/MIC状态等。支持iKVM远程管理; 8.服务器热图:支持热图方式集中展现集群中所有服务器的关键指标,如CPU利用率、内存利用率、网络可用性、电源状态、温度等,支持指标快速切换; 9.状态分析视图:提供调度系统状态分析视图Dashboard,直观展示集群、队列、用户等不同视角的资源使用信息和作业负载信息,为管理员的调整优化提供决策依据; 10.数据分析:支持节点健康度按照(关机时间,管理网不可用,告警数量)进行统计分析; 节点用量统计分析(相对一分钟负载,内存利用率,磁盘利用率,磁盘增长量,功耗); 11.网络监控:支持IB/以太网的网络监控与端口流量分析; 12.监控首页:支持集群负载,集群功耗,健康度,共享存储等统计分析; 13.告警策略:支持自定义告警策略,实现页面预警、邮件告警等通知方式;符合告警策略条件将会产生相应告警信息并通过邮件、短信方式通知负责人; 14.报表指标:提供丰富的服务器(或服务器组)报表指标,包括CPU平均利用率、内存使用率、内存使用量/剩余量、磁盘(或磁盘分区)使用率、磁盘(或磁盘分区)使用量/剩余量、网卡接收/发送速率、磁盘读写速率等; 提供丰富的交换机报表指标,包括交换机内存、交换机CPU/内存利用率、交换机端口输入流/输出流、交换机输入错误率/丢失率、交换机输出错误率/丢失率等; 15.报表预定义:支持将所选参数保存为预定义报表,双击即可生成报表,方便后续使用; 16.一键配置集群:提供灵活强大的集群配置能力,可以一键完成对整个集群的检测和配置,如检测网络可用性、配置ssh/rsh无密码登*、停止系统冗余服务、配置NFS、同步集群时间、同步集群用户等。管理员可以灵活组合不同的配置项; 17.用户管理:支持对平台用户数据库用户和各类操作系统用户(如本地用户、NIS、LDAP等)的统一管理,支持用户的创建、修改、删除、冻结和激活操作; 18.大规模多指标监控:支持大规模监控管理,系统采集节点规模支持50000+节点,采集指标数量1000+种,采集秒级反馈,查询秒级响应; 19.webshell:支持图形化集成命令行窗口; 20.通知消息管理:提供消息管理功能,允许管理员查询或者删除平台使用过程中产生的各类通知消息,如作业通知消息、申请/审批消息、故障单提交/处理消息; 21.应用Portal:提供所有常见高性能应用的作业提交Portal,整合文件管理、VNC等功能,有效降低工程应用人员使用HPC集群的门槛; 22.队列管理:支持基于Web的队列管理,各队列可设置不同的资源配额、访问策略和调度策略; 23.调度策略:支持基于队列、用户、用户组等多个维度的优先级定义策略,根据作业的静态(如资源请求、所属用户等)和动态指标(如入队时间、公平共享份额等),通过不同的权重设置,灵活控制作业优先级;支持作业回填,有效平衡大作业和小作业的调度,提高集群作业吞吐量,支持作业多级抢占,支持对被抢占作业进行“挂起”、“重新入队”等处理操作; 24.用户资源配置:支持基于Web的用户管理,设置不同用户的用户类型、用户优先级、资源配额、可访问队列等; 25.预付费支持:支持计费账号管理,允许多个用户使用一个计费账号;支持通过“先充值后扣费”方式使用集群资源,只有账号余额充足时才能运行作业; 26.多视角统计:支持从用户、队列、节点、应用、账号、作业规模等不同角度进行统计计费; 27.多视角统计:支持基于CPU、GPU、存储空间计费; 28.计费详表:支持导出作业粒度的计费详表,供用户核对;支持GPU、存储计费; 29.大规模:支持大批量作业的实时调度,支持最大瞬时大规模作业(超过3000+个)的同时提交,支持大批量作业的动态优先级调动并发瞬时吞吐率峰值(2000+个),支持15000节点的资源调度; 30.高性能计算在线运维模块:提供1年高性能计算集群在线运维服务,本次提供商业版成熟的远程运维服务模块,支持7*24小时远程运维监控、运维管理的工作, | 600.0000 | 2023年02月 |
广西
广西
广西
广西
广西
广西
最近搜索
无
热门搜索
无