序号 | 项目 | 要求 | 招标技术要求 |
1 | SAN存储扩容 | 扩容存储空间 | 现有两台存储软硬件扩容 扩容闪存盘≥10块3.8TB闪存盘,扩容≥52块2.4TB SAS磁盘,扩容≥40块6TB SATA磁盘。 包含以上磁盘所需的磁盘柜。 以上磁盘必须兼容HUSVM,扩容后由HUSVM_A 统一管理及分配容量。 |
扩容软件许可 | 增加HUSVM_A SVOS存储管理软件200TB许可。 增加HUSVM_A 动态分层200TB许可。 增加HUSVM_A 缓存分区200TB许可。 增加HUSVM_A 本地复制软件200TB许可。 增加HUSVM_A 性能监控200TB许可。 增加HUSVM_B远程复制软件200TB许可。 |
2 | 存储 | 扩容存储空间 | 电子政务资源中心存储扩容SATA磁盘。Raid6后可用容量≥200TB。 包含以上磁盘所需的磁盘柜。 |
3 | NAS | △节点扩容要求 | 增加一套NAS节点,可与现有的长虹佳华HNAS形成高可用群集,群集能够互为分担业务量,并当其中一个节点出现故障时,能够接管所有业务,使业务不受影响。 |
△节点内存要求 | NAS节点配置≥32GB缓存。 |
节点性能要求 | 提供在第三方权威评测机构SPEC的测试性能指标,单节点情况下SPEC_sfs IOPs值不低于72,000 |
吞吐量要求 | 每个节点或控制器的吞吐量不低于1000MB/s |
△计算架构 | 采用专利技术的双通道体系结构,包含至少4个可编程逻辑电路芯片(FPGA)来进行网络协议和存储协议的处理,保证了多任务并行处理,保证了高性能的要求。 需提供产品白皮书证明 |
网络 | 每个节点配置不少于6个万兆以太网接口。 |
协议 | 支持以下网络共享协议,包括:NFS V2/V3/V4, CIFS V2, iSCSI, TCP, UDP, ICMP, FTP, NDMP等 |
△配置协议 | 本次需配置NFS、CIFS许可 |
FC端口 | 配置4个8Gb后端光纤接口; |
△文件系统大小 | 每个文件系统可支持到≥256TB |
文件系统数量 | 可支持的文件系统数目不小于128个 |
单个目录文件个数 | 单个目录文件个数不少于1600万 |
操作系统 | 支持AIX、HP-UX、Solaris、Windows NT、Windows 2000、Windows2003/2008、Tru64 UNIX、SGI IRIX、NCR、Novell NetWare、Linux、OpenVMS、VMware等操作系统 |
防病毒 | 支持与防病毒软件结合使用 |
本地数据保护 | 支持NDMP方式对NAS上存储的文件进行备份,实现本地数据保护。 |
快照 | 支持无性能损失的快照功能。可以在瞬间完成快照的创建,并且快照数目的增加和快照频率的加快不会对存储设备的整体性能产生影响 |
快照数量 | 每个文件系统最大可创建不少于1024份快照 |
消重 | 提供文件系统块级别的消重功能 |
分层文件系统 | 支持分层存储管理功能根据用户预先定义的文件策略自动将数据文件迁移到其它存储层或者外部存储设备,并将文件指针留在原有文件系统中,从而保证了对用户透明移动,不会感觉到数据在分层存储之间的数据移动。 |
4 | 数据分析设备 | 总体要求 | 为了更好地满足侵权预警的数据分析要求,所提供的数据分析设备必须: ? 具备分布式可扩展部署和大数据分析处理功能; ? 具备7*24小时稳定运行能力; ? 具备整合大数据检索,自然语言处理,关联关系分析,信息比对等功能,通过对数据资源的抽取、转换、映射、关联等步骤,提供一个全量数据的检索服务功能; |
△基本要求 | 设备能在 TB级规模数据上高效进行各种稳定的统计分析,能满足对企业级大数据生产环境的数据处理需求; 设备具备统一管理所有计算资源的功能:可以按需动态创建不少于 3 个数据处理和分析集群,并可对资源进行配额管理; 设备具备完整的 SQL 支持功能:能支持兼容SQL"99、PL/SQL 和 HiveQL,自动识别语法,提供兼容现有的基于 Hive 开发的应用接口; |
分布式计算 | 设备能够支持分布式部署,实现集群,负载均衡,可在线动态扩充,系统性能能够随着系统服务器数目的增加平滑线性增长。 |
运维要求 | 设备具备统一管理所有计算资源的功能,并可对资源进行配额管理; 设备具有图形化监控管理手段,监控内容包括但不限于:集群节点的运行状态、资源利用情况、网络通讯情况、图形化的启动、停止、删除节点、新增节点、迁移任务、迁移数据等操作; 设备支持在线的节点变动,在线增加、删除节点时,能支持数据和索引自动平衡功能,保证平滑扩展和性能的线性增减。 |
数据采集方式 | 为了侵权预警的业务人员集成电商数据,设备需要采用多种数据采集方式: 采集方式包括但不限于:流方式、批量导入方式、实时数据采集、外部数据文件导入、异构数据库导入、主动数据抽取、增量追加方式、网上爬虫方式等。 |
△数据清洗 | 为实现侵权预警的业务人员清洗电商数据,设备支持与数据清洗集成ETL工具集成,提供数据抽取、清洗、集成等功能。 |
数据处理 | 为了侵权预警的业务人员处理电商数据,设备需要: ? 提供对多计算框架管理的支持功能。计算框架包括但不限于:批处理计算框架、内存计算框架、流计算框架等。 ? 提供并行计算及并发处理功能,支持多服务器、多CPU、多进程并行及并发处理数据的机制。 ? 支持PL/SQL存储过程、分布式事务及自定义函数功能。 |
△电商数据查询 | 为了侵权预警的业务人员查询电商数据,设备需要: ? 支持OLAP查询功能。内置OLAP函数;支持超大数据立方,支持雪花、星型等复杂分析模型。 ? 支持SQL查询功能,支持国际SQL92、SQL2003标准。 ? 支持数据字典、动态SQL执行、视图、子查询、JOIN 查询功能。 ? 支持全文检索。支持中文字符集,实现中文分词功能。 ? 支持结构化数据和半/非结构化数据联合查询功能。 |
易于集成 | 为了更好地支持主流第三方BI、ETL等工具,需要设备支持常见软件产品集成: ? 支持各种常见的大数据分析软件,例如SAS、SPSS,MicroStrategy, IBM Cognos等; ? 支持常见的数据可视化工具集成,例如Tableau,Pentaho等; ? 支持常见的关系型数据库集成,支持与各种常见的关系数据库的对接和数据交换。 |
开放性要求 | 设备跟进开源社区的标准,保持和开源的兼容性,设备支持Hbase,Hive,Oozie、Spark、Yarn、Sqoop、ZooKeeper等各种知名的Hadoop开源组件。 |
△与现有数据源集成要求 | 提供与现有的Oracle、SQL Server、MySQL、MongoDB数据库、对象存储HCP等数据源集成。 设备支持通过S3协议写入数据到现有对象存储HCP。 |
硬件指标要求 | 提供1台服务器作为管理节点承载以上业务需求。服务器配置要求:处理器配置≥12内核,配置≥64GB内存,2个万兆光纤网口,2个16Gb/s FC端口。 |
△实施服务要求 | 供应商完成平台所需组件的部署,实施规模不少于12个节点。组件包括HDFS,Hive,impala,HBASE,Spark等。 需完成专利侵权,商标侵权,著作权侵权三个业务的设计与部署。工作量不少于7个人月。 要求提供针对此业务系统开发的代码和使用许可。 实施过程配合上层业务需求构建数据结构,提供相关数据及运算服务。 提供平台运维管理培训,培训时长不少于5天。 |
5 | 侵权预警设备 | 业务总体需求说明 | 知识产权的相关结构化数据及非结构化数据的激增,需要通过文本、音频、视频的特征提取,为相关业务服务,提供系统化,自动化,科学化的技术支持,针对知识产权侵权及仿冒行为提供数据量化逻辑并输出结果。 此行业务需求说明无需应答 |
△数据集成 | 要求所提供设备可以读取Hadoop大数据平台和现有的对象存储HCP的原始数据。 |
预测模型与算法需求说明 | 为满足侵权预警业务的需求,中标供应商应按要求提供以下9大类算法,并在项目实施过程中根据需求组合成预测模型,算法具体要求如下: 说明:预测模型是可以由单一算法或者是多个算法组合形成来满足需求。本次预测模型的数量验收计算方式为:每个业务场景中的单一或者混合多种算法均可分别计为一种预测模型。 此行为预测模型需求说明无需应答。 |
基于内容的分类处理算法 | 提供不少于4个基于内容的分类处理算法。 |
基于结构的分类处理算法 | 提供不少于4个基于结构的分类处理算法。 |
基于内容的聚合处理算法 | 提供不少于4个基于内容的聚合处理算法。 |
基于结构的聚合处理算法 | 提供不少于4个基于结构的聚合处理算法。 |
基于内容的特征处理算法 | 提供不少于3个基于内容的特征处理算法。 |
基于结构的特征处理算法 | 提供不少于3个基于结构的特征处理算法。 |
基于内容的分层聚类算法 | 提供不少于3个基于内容的分层聚类算法。 |
基于内容的关联处理算法 | 提供不少于3个基于内容的关联处理算法。 |
基于结构的关联处理算法 | 提供不少于3个基于结构的关联处理算法。 |
△文档要求 | 供应商实施后必须提供标准算法文档,同时实施完成后提交源代码。 |
预警分析评估要求 | 要求供应商在进行模型算法调优后,实现ROC曲线(加权平均)大于等于0.75,AUC面积(加权平均)在大于等于0.7。置信度范围大于等于95% |
监测结果输出 | 要求:以业务需求为导向,结合业务场景需求,系统能够提供监测预警结果。 |
硬件指标要求 | 提供1台服务器承载以上业务需求。服务器配置要求: 处理器配置≥12内核,每个节点配置≥64GB内存,2个万兆光纤网口,2个16Gb/s FC端口。 |
△服务要求 | 完成各种业务场景的模型设计,并与业务系统对接。 完成专利侵权,商标侵权,著作权侵权三类比对分析业务模型算法的设计与部署。根据业务需求调整模型算法参数,对输入输出进行调试,满足业务判断潜在侵权行为的需求,并输出结果。 对模型参数调整,系统管理进行培训,培训时长不少于5天。 提供4次模型参数调优支持服务。 |