军民融合科技信息资源数据优化处理服务中标结果

军民融合科技信息资源数据优化处理服务中标结果





公告概要:
公告信息:
采购项目名称军民融合科技信息资源数据优化处理服务
品目

服务/信息技术服务/数据处理服务/其他数据处理服务

采购单位四川省国防科技情报研究所
行政区域锦江区公告时间2018年09月05日 15:48
本项目招标公告日期2018年08月22日成交日期2018年09月03日
谈判小组、询价小组成员、磋商小组成员名单及单一来源采购人员名单胡欢 罗劲松 刘新利
总成交金额¥10.000000 万元(人民币)
联系人及联系方式:
项目联系人徐老师
项目联系电话***-********
采购单位四川省国防科技情报研究所
采购单位地址成都市东华正街33号
采购单位联系方式徐老师 ***-********
代理机构名称四川政达招投标代理有限公司
代理机构地址成都市人民北路二段188号金牛万达广场甲级写字楼A座1912号
代理机构联系方式陈老师 ***-********


四川政达招投标代理有限公司受四川省国防科技情报研究所的委托,就“军民融合科技信息资源数据优化处理服务”项目(项目编号:(川政达采比〔2018〕3-46号))组织采购,评标工作已经结束,成交结果如下:

一、项目信息

项目编号:(川政达采比〔2018〕3-46号)

项目名称:军民融合科技信息资源数据优化处理服务

项目联系人:徐老师

联系方式:***-********

二、采购单位信息

采购单位名称:四川省国防科技情报研究所

采购单位地址:成都市东华正街33号

采购单位联系方式:徐老师 ***-********

三、采购代理机构信息

采购代理机构全称:四川政达招投标代理有限公司

采购代理机构地址:成都市人民北路二段188号金牛万达广场甲级写字楼A座1912号

采购代理机构联系方式:陈老师 ***-********

四、成交信息

招标文件编号:(川政达采比〔2018〕3-46号)

本项目招标公告日期:2018年08月22日

成交日期:2018年09月03日

总成交金额:10.0 万元(人民币)

成交供应商名称、地址及成交金额:

序号成交供应商名称成交供应商联系地址成交金额(万元)
1成都鑫海天地科技有限责任公司成都市锦江区大业路6号1栋3单元7层715号10.000000

本项目代理费总金额:0.4 万元(人民币)

本项目代理费收费标准:

参照计价格〔2002〕1980号收取

谈判小组、询价小组、磋商小组成员名单及单一来源采购人员名单:

胡欢 罗劲松 刘新利

五、项目用途、简要技术要求及合同履行日期:

一、参数

1.数据范围

1.1资源类型

序号

数据类型

全文数据库

1

期刊论文

军民融合科技信息期刊数据库

2

会议论文

军民融合科技信息论文数据库

3

科技报告

军民融合科技信息报告数据库

4

图书

超星图书、外文数字图书等


2.数据分析

2.1军民融合科技信息资源数据库元数据字段内容分析

1)主要分析内容

对军民融合科技信息资源数据库期刊、会议、科技报告和图书四种类型的数据库元数据字段内容进行详细分析,主要包括数据乱码情况、数据格式、字段内容著录的准确性、字段的完整性、字段名称表述的一致性,以及军民融合科技信息资源数据分析等,特别是对于DOI、作者、机构、ISSN和ISBN等关键字段内容的研究与分析。

2)实现目标

通过对数据库元数据字段内容的分析确定在当前情况下我们还需要做哪些数据准备工作,例如:是否需要进一步确定信息服务平台各种类型资源元数据规范与标引方案;是否需要对现有乱码数据进行替换;对数据库商数据提供方式和格式要求等是否需要进一步明确和增加新的需求;信息服务平台现有的数据处理工具是否能够满足今后的需求,是否需要开发新的数据处理工具等。总之,通过数据分析对前期我们需要做的数据准备工作提出明确建议和指导。

进行数据分析还有一个重要的目的就是对军民融合科技信息资源数据库的数据清洗和去重以及数据替换方法能够给出更详细的建议,例如:通过数据分析明确是否需要先对属性字段进行清洗,排除空格、标点符号等影响,生成查重字段;明确数据去重的关键对比字段,确定字段抽取规则,研究数据去重的主要方法和去重规则。总之,通过数据分析能够最终明确后期数据查重和替换的具体工作流程和方法,提交讨论稿,最后讨论确定具体去重方案。

通过主要字段的对比分析和字段名称表述一致性分析确定数据库中元数据字段的映射关系(关联关系),特别是文摘库与全文库之间的关联关系,使字段名称形成统一的规范,使字段格式更加标准,后为期数据查重和替换奠定基础。

3.数据去重与数据整理

3.1军民融合科技信息资源数据库各种类型资源论文元数据的去重与整理

1)去重方法

利用上文中数据分析得出的数据去重规则、方法、工具和流程对军民融合科技信息资源数据库论文元数据进行数据查重和数据整理,使论文元数据具有唯一性。

2)实现目标

前台检索:在军民融合科技信息资源数据库统一检索时,相同数据只出现一条,并标明所属数据库;

统一索引:对于文摘数据库和全文数据库以及不同数据库中收录的同一条元数据,从各个数据库抽取字段填充至数据仓储中形成统一索引,保证统一索引中只有一条记录;

对数据仓储中的数据添加唯一标识,生成具有唯一属性的元数据总库;

根据数据之间的重复关系标明数据来源,并生成挂接关系库,记录元数据总库中数据的挂接关系;

根据数据之间的重复关系生成地址库,记录元数据总库中数据的挂接和全文地址;

3.2期刊、会议元数据的去重与整理

1)去重方法

利用上文中数据分析得出的数据去重规则、方法、工具和流程对军民融合科技信息资源数据库期刊和会议进行数据查重和数据整理,使期刊和会议具有唯一性。

2)实现目标

前台检索:在军民融合科技信息资源数据库检索期刊(或会议)时,相同期刊(或会议)只出现一条,并标明所属数据库;

期刊统一索引:对于相同数据库中的重复期刊、不同数据库中收录的重复期刊,以及本地数据库和链接数据库中收录的相同期刊,从各个数据库抽取字段填充至期刊统一索引,保证期刊统一索引中只有一条记录,并对期刊进行正确标引;

会议统一索引:对于相同数据库中的重复会议、不同数据库中收录的重复会议,以及本地数据库和链接数据库中收录的相同会议,从各个数据库抽取字段填充至会议统一索引,保证会议统一索引中只有一条记录,并对会议进行正确标引;

对期刊、会议数据仓储中的期刊和会议数据添加唯一标识,生成具有唯一属性的期刊和会议元数据总库;

根据期刊元数据总库生成期刊导航;

根据会议元数据总库生成会议导航;

根据期刊、会议之间的重复关系标明来源数据库,记录期刊、会议元数据总库中期刊、会议数据的挂接关系;

4.全文文件规范

4.1方法

1)利用已有数据与军民融合科技信息资源数据库元数据字段的映射关系和数据匹配规则,对于能够覆盖到的全文数据,对我单位全文数据进行替换。

2)对用户提供的文件数据进行加密解密,同时提供批量数据加密解密工具软件。

4.2实现目标

4.2.1全文数据无乱码并且格式规范

目前由于数据库商数据提供的质量参差不齐,信息服务数据处理方法和手段的局限,以及数据检查机制的欠缺,使得目前军民融合科技信息资源数据库有不规范数据及乱码存在,影响用户使用。数据清洗和全文数据替换完成后,乱码现象不再存在。

4.2.2数据的准确性和完整性

对军民融合科技信息资源数据库数据进行清洗、查重和全文数据替换后,数据不仅应具有唯一性和不同数据来源的一致性,而且数据应具有准确性和完整性。数据的准确性包括元数据标引信息准确、字段名称和字段内容相符、无拼写错误、来源数据库标识准确、链接地址标识准确等;数据的完整性包括字段数量完整、字段著录内容完整(不为空)、无丢失数据等。因此,在数据清洗和替换工作完成后应利用工具对数据准确性和完整性进行检测,对错误值或者异常值进行重新处理。

5.文献资料保密及技术成果归属

承诺对贵单位数据优化项目有关技术、资料保密及数据保密。在项目实施期间,不得将相关的文献资料和加工好的数字化资料带出加工场地,不准把硬盘、U盘、软盘等存储介质带进数字化加工现场。

最后项目验收合格后的知识产权归客户方所有,为其保密并不得为第三者复制

六、成交标的名称、规格型号、数量、单价、服务要求:

成交标名称:军民融合科技信息资源数据优化处理服务

单价:10万元

服务要求:

主要分析内容

对军民融合科技信息资源数据库期刊、会议、科技报告和图书四种类型的数据库元数据字段内容进行详细分析,主要包括数据乱码情况、数据格式、字段内容著录的准确性、字段的完整性、字段名称表述的一致性,以及军民融合科技信息资源数据分析等,特别是对于DOI、作者、机构、ISSN和ISBN等关键字段内容的研究与分析。

2)实现目标

通过对数据库元数据字段内容的分析确定在当前情况下我们还需要做哪些数据准备工作,例如:是否需要进一步确定信息服务平台各种类型资源元数据规范与标引方案;是否需要对现有乱码数据进行替换;对数据库商数据提供方式和格式要求等是否需要进一步明确和增加新的需求;信息服务平台现有的数据处理工具是否能够满足今后的需求,是否需要开发新的数据处理工具等。总之,通过数据分析对前期我们需要做的数据准备工作提出明确建议和指导。

进行数据分析还有一个重要的目的就是对军民融合科技信息资源数据库的数据清洗和去重以及数据替换方法能够给出更详细的建议,例如:通过数据分析明确是否需要先对属性字段进行清洗,排除空格、标点符号等影响,生成查重字段;明确数据去重的关键对比字段,确定字段抽取规则,研究数据去重的主要方法和去重规则。总之,通过数据分析能够最终明确后期数据查重和替换的具体工作流程和方法,提交讨论稿,最后讨论确定具体去重方案。

通过主要字段的对比分析和字段名称表述一致性分析确定数据库中元数据字段的映射关系(关联关系),特别是文摘库与全文库之间的关联关系,使字段名称形成统一的规范,使字段格式更加标准,后为期数据查重和替换奠定基础。

3.数据去重与数据整理

3.1军民融合科技信息资源数据库各种类型资源论文元数据的去重与整理

1)去重方法

利用上文中数据分析得出的数据去重规则、方法、工具和流程对军民融合科技信息资源数据库论文元数据进行数据查重和数据整理,使论文元数据具有唯一性。

2)实现目标

前台检索:在军民融合科技信息资源数据库统一检索时,相同数据只出现一条,并标明所属数据库;

统一索引:对于文摘数据库和全文数据库以及不同数据库中收录的同一条元数据,从各个数据库抽取字段填充至数据仓储中形成统一索引,保证统一索引中只有一条记录;

对数据仓储中的数据添加唯一标识,生成具有唯一属性的元数据总库;

根据数据之间的重复关系标明数据来源,并生成挂接关系库,记录元数据总库中数据的挂接关系;

七、其它补充事宜



标签: 处理 优化 数据

0人觉得有用

招标
业主

四川政达招投标代理有限公司

关注我们可获得更多采购需求

关注
相关推荐
 
查看详情 免费咨询

最近搜索

热门搜索