计算机科学学院集群计算资源管理软件授权购置网上竞价采购公告

计算机科学学院集群计算资源管理软件授权购置网上竞价采购公告

项目名称 集群计算资源管理软件授权购置 项目编号 WSJJ********
公告开始日期 2023-09-20 16:26:51 公告截止日期 2023-09-23 18:00:00
采购单位 陕西师范大学 付款方式 国产-本项目质量保证期履约保证金为合同总额的5%。甲方验收合格后,乙方向甲方足额交付履约保证金并出具全额正规发票后,甲方一次性支付全额货款;质量保证期满,经甲方对乙方保修质量验收合格后,一次性退还履约保证金,履约保证金不计利息;质量保证期满后六个月内,若乙方未向甲方提出对保修质量进行验收的申请,视为乙方自动放弃履约保证金,甲方不再受理退还手续,质量保证期履约保证金可由甲方自行处理。
联系人 中标后在我参与的项目中查看 联系电话 中标后在我参与的项目中查看
签约时间要求 成交后1个工作日内 到货时间要求 签订之日起3个工作日内
预算总价 ¥ 400,000.00 + + 未公布
收货地址 陕西师范大学(长安校区)
供应商资质要求

符合《政府采购法》第二十二条规定的供应商基本条件

公告说明
采购清单1
采购商品 采购数量 计量单位 所属分类
Eaas高性能计算云平台 20 行业应用软件 无 无
品牌 品牌1 联旌智能
型号 Eaas1.0
品牌2
型号
品牌3
型号
预算单价 ¥ 20,000.00
技术参数及配置要求 (一)公共计算平台
随着各种类型计算场景的出现,HPC集群不仅仅需要提供传统的HPC的计算需求,也需要满足其他类型的应用场景,包括大数据、人工智能、桌面可视化、windows交互和教学实训资源支撑等。另外,随着公共计算平台的建设和规模的扩大,引进专业的平台维护团队,一方面服务好学校的学生使用,另一方面也可以借鉴其他领先高校的平台使用经验,提升效率和竞争力。顾在本次项目中,引进第三方专业软件平台厂商。
(二)技术规格
1 公共计算平台总体要求 提供拥有软件著作权的商业版本管理软件,不接受开源产品。提供本次项目所有节点授权。在国内设有研发机构,能根据用户的需求或使用习惯进行定制化开发。提供产品应用于大规模CPU集群(单一系统节点数>150台)和GPU集群(单一系统内GPU数量>400块)生产环境的成功案例及用户证明。所有管理软件必须基于B/S架构。支持通过主流WEB浏览器管理和使用平台资源。
2 公共计算平台架构和系统支持 统一平台,统一资源池,统一资源调度。支持调度多种任务类型,包括单节点容器、虚拟机、多节点HPC集群、Hadoop集群、AI训练集群等。(提供截图证明材料)同时支持两类资源虚拟化技术,包括虚拟化和容器虚拟化技术。支持各种常见的操作系统发行版(Windows各版本、Linux各版本)并提供部署模板。支持x86、ARM、KNL等架构服务器,支持NVIDIA GPU、FPGA、Altas等异构服务器。
3 公共计算平台系统管理要求 通过界面统一管理平台用户,支持与外部LDAP服务器或Windows AD域控集成,支持与现有统一身份认证系统对接。提供不少于三种角色,包括系统管理员、群组管理员和普通用户;支持群组管理员和普通用户创建群组并邀请其他用户加入(提供截图证明材料)。支持对用户的资源使用量进行限额,便于管理员合理分配集群资源,可以修改每个用户或用户组的最大可用CPU核数、GPU个数、内存使用量、存储空间、实例数等(提供截图证明材料)。支持管理员对应用运行时所需环境的配置修改,参数包含所属资源池、CPU、内存、GPU、块存储等信息(提供截图证明材料)。支持设置用户虚拟机实例、容器实例的使用周期,到期自动回收资源并提前自动通知用户。支持到期前手动延长使用周期。支持应用的可见性权限设置,配置用户能访问的应用。支持不同的资源池配置不同的应用策略,应用策略包括实例关闭资源自动释放和实例关闭资源不释放等。支持回收站功能。实例释放后自动进入回收站中,可通过回收站对实例进行恢复或彻底删除。平台支持通过WEB页面对GUI类应用进行访问和操作,支持远程桌面交互、字符界面交互、网页界面在线交互式编程等模式。
4 公共计算平台数据管理要求 平台提供数据集统一管理的功能,数据绑定用户,不与节点绑定。提供同一用户的不同计算实例之间的数据共享功能,提供不同计算实例中的程序可以同时对用户数据目录进行读写访问的功能。平台提供用户目录,项目目录,共享群组目录等数据管理的功能,在项目组中,用户可以通过共享目录进行数据共享,也可以在项目组中有自己私有的数据目录。(提供截图证明材料)平台提供通过浏览器上传计算配置文件和下载计算结果以及断点续传等功能,支持用户本地挂载平台数据目录,实现用户本地、平台和实例环境的数据同步,支持用户本地是Windows操作的数据挂载。(提供截图证明材料)
5 公共计算平台容器场景功能要求 支持容器虚拟集群在多个用户之间的共享,支持在同一虚拟集群内用户之间的数据共享。在容器内多节点并行计算的性能损耗和物理机相比在1%以内。(提供证明材料),容器中支持普通用户以虚拟超级用户权限对系统修改,进行系统更新操作或安装软件。支持以透传的方式实现容器对物理GPU的访问,支持单机单卡和单机多卡的单容器环境,支持多机多卡容器化分布式GPU训练集群。支持基于ARM架构的容器场景。支持GPU共享,支持在1块GPU卡上,同时运行多个GPU容器环境,分配GPU可以按照0.1块、0.2块分配。支持通过软件仓库一键创建完整独立的容器环境,包括桌面可视化环境、Slurm集群环境、Torque集群环境、hadoop环境、Jupyter在线web交互环境等。(提供截图证明材料)。
6 公共计算平台虚拟化场景功能要求 支持以透传的方式实现虚拟机对物理GPU的访问,并设置每台虚拟机可使用的GPU数,在该环境内,用户有root权限,可自行安装和配置环境。支持基于ARM架构的虚拟化场景。支持通过网页界面生成和恢复虚拟机快照;支持windows系统的远程桌面可视化操作,以及通过windows系统实现硬盘扩容等功能。(提供截图证明材料)支持通过软件仓库一键创建完整独立的虚拟化环境,包括完整的linux操作系统环境、Windows桌面环境等。(提供截图证明材料)
7 公共计算平台集群场景功能要求 支持主流的HPC作业调度软件,支持至少2种调度器并存。系统支持同时运行和管理多个容器虚拟集群环境,每个集群可采用独立的调度器,虚拟集群之间互相隔离,不受影响。支持普通用户手动调整自己的容器虚拟集群的规模。支持容器虚拟集群的自动动态伸缩:在虚拟集群空闲时自动释放容器实例,在虚拟集群有负载时自动启动所需容器实例。支持通过作业模板方式在Web页面提交作业;支持用户创建个人作业模板;支持管理员创建全局作业模板。支持查看每个作业的运行资源使用情况。支持同一用户在不同独立集群中进行任务提交,并可以查看自己提交的任务在不同集群中的状态。支持多数据中心集群资源统一管理,支持直接对接公有云和超算中心资源。
8 公共计算平台大数据场景功能要求 支持通过Web可视化的形式管理Hadoop组件,支持在线直接安装、管理和运维Hadoop集群。支持HDFS、Spark、MapReduce、Hive、Pig、Hbase、Zookeepr、Sqoop和Hcatalog等的集中管理。支持Hadoop集群的多角色用户管理,角色包括普通用户、服务运维员、服务管理员、集群运维员、集群管理员等。支持大数据的集群监控,支持监控CPU、内存、节点状态、HDFS状态等信息,并通过可视化的形式展示出来。支持大数据的告警功能,支持WEB、Port、Metric、Aggregate 和 Script等类型,支持自定义报警信息,支持OK 、Warning、Critical、Unknown、None等多种报警状态,支持配置报警的检测时间间隔、类型、以及阈值等。
9 公共计算平台资源统计功能要求 平台提供集群运行情况监控功能,包含集群数量、集群应用软件类型、正在运行的用户等,支持统计应用镜像的使用数量。支持分别根据CPU、GPU、内存等资源采用不同的费率标准进行分类计费,支持在系统管理中设置默认权值。(提供截图证明材料)。支持不同的节点、不同的资源池设定不同的费用,可以单独配置每一个硬件资源的费用。(提供截图证明材料)。
支持用户充值和透支额度设置,支持项目透支额度设置,支持用户转账自己剩余点数到任意一个自己的项目中,在项目中的其他用户可以使用该项目的点数进行扣费,支持对项目中用户使用点数查看和设定限额。(提供截图证明材料)。支持对个人资源使用和团队资源使用计费;支持对团队中个人使用费用的统计(提供截图证明材料)。支持对从不同维度(CPU资源、GPU资源、用户、应用等)对平台的历史数据进行自定义查询、过滤和可视化展示。
10 软件环境 GNU C/C++/F77/F90编译器、Java、Intel C/C++/Fortran编译器,Intel MKL、BLAS、LAPACK、FFTW等数学库,并行编程消息库如Intel MPI、OpenMPI等,预置常见的操作系统镜像和常用开源计算应用镜像。支持容器化数据分析工具,支持Python, Anaconda, R等,并支持用户自定义软件包安装。支持容器化大数据处理框架,如Cloudera CDH等。支持容器化GPU多机多卡分布式训练框架,包括Tensorflow,Pytorch等,支持分布式训练框架与作业调度系统集成。
11 在线运维 完成对高性能计算集群远程在线监控、异常告警通知等工作。在线运维服务监控采购方高性能集群服务器、网络等相关资源状态信息,如发现异常信息、故障信息,则将此类信息第一时间通知用户方,并采取相关措施。客户提供的商业软件的安装及调度集成。客户所需开源软件的安装、编译及优化,应用软件作业模板的定制及优化,应用软件的容器模板制作,应用软件的虚拟机模板制作,平台应用商店内软件的升级和更新,系统GPU驱动/CUDA版本的持续更新和升级,平台内部组件的持续升级,平台新版本功能更新的持续安装,平台硬件环境的运维监控,系统报警、平台故障的实施处理,平台资源使用情况的监控及使用报告,调度策略的持续优化和调整,用户配额和QOS的持续优化,用户微信群进行实时问题解答和使用帮助
售后服务 电话支持:7x24小时;质保期:5年;响应时间:报修后12小时;商品承诺:原厂全新未拆封正品、 送货上门/安装调试/技术培训;

陕西师范大学

2023-09-20 16:26:51



信息来源:http://zbb.snnu.edu.cn/provider/#/publish/20LMRHD8AOHIZEOE

标签: 集群 软件

0人觉得有用

招标
业主

-

关注我们可获得更多采购需求

关注
相关推荐
 
返回首页

收藏

登录

最近搜索

热门搜索