(略) - 竞价公告 (CB
点击查看>> ) 发布时间:
点击查看>> * : * : * 截止时间:
点击查看>> * : * : * 基本信息: 申购单号:CB
点击查看>> 申购主题:大数据与人工智能科研软件平台 采购单位: (略) 报价要求:国产含税 发票类型:增值税专用发票 币种:人民币 预算:
点击查看>>点击查看>> 签约时间:发布竞价结果后7天内签约合同 送货时间:合同签订后 * 天内送达 安装要求:免费上门安装(含材料费) 收货地址: (略) 省/ (略) 市/ (略) 区/
点击查看>>* 我要报价 付款方式:货到验收合格后付款 备注说明: 1 同类项目要求:竞价期间提供大数据与人工智能相关同类项目合同3份; 2 人员资质要求:竞价期间提供Cloudera (略) 技术支持工程师的技术证书; 3 竞价期间提供大数据人工智能实训科研平台相关软件著作权证书; 4 竞价期间提供大数据人工智能实训平台产品第 * 方测试报告; 5 竞价期间提供利用大数据与人工智能科研平台支撑过国家自然基金大数据人工智能相关项目的证明; 6 提供软件平台大数据与人工智能科研平台管理模块融通共享实施方案; 7 投标人作为中标候选人后, (略) 提供产品演示和试用, (略) 有参数达到要求,如果不能满足参数要求,则由后 * 个中标候选人中标,依次类推。 申购明细: 序号 1 采购内容 大数据与人工智能科研软件平台 数量 1套 预算单价 品牌 最新 型号 最新 规格参数 1、
基于可视化的数据挖掘分析系统 1.1 可视化数据采集模块功能要求: ?
(略) 页、拖拽式、零代码的可视化数据收集能力。 ?
提供可视化数据爬取的能力,支持登录验证、网页信息选择及下载、自动滚屏加载、 自动翻页的数据爬取全流程覆盖。 ?
提供可视化数据导入的能力,支持的数据源包括文本文件、SQL数据库、Hadoop分布式文件系统、NoSQL数据库、云存储。 ? 数据爬取时并发进程数不低于 * 个每秒,爬取性能不低于 * 个页面每秒。 ?
内置智能反爬引擎,每个爬取请求动态生成HTTP头,且能 (略) 为随机化爬取间隔、客户端浏览器信息等。 ?
能够配置爬取策略,至少包含深度优先搜索爬取和广度有限搜索爬取。 1.2 可 (略) 理模块功能要求: ?
(略) 页、拖拽式、零代码的可 (略) 理能力。 ?
提供可视化数据清洗和特征变换的能力,包括数据过滤、数据清洗、数据生成、数据变形、网络日志解析、地理信息解析。 ?
提供可视化数据聚合和连接的能力,可配置的项目包括分组变量、连接变量、聚合方法、连接方法(内连接、左/右连接、全连接)、输出变量。 ?
提供可视化特征工程的能力,包括特征选择、特征生成(线性组合、多项式组合)、特征降维(根据与目标变量的相关性、基于树类模型、主成分分析、基于LASSO回归模型)。 ?
提供可视化探索性数据分析的能力,支持抽取 * 定的样本,得到各变量的快速统计信息和数值分布。 ?
支持以图表的形式做探索性数据分析,图表以拖拽的方法得到,支持的图表类型包括折线图、柱状图、散点图、饼图、表格、地理信息图。 ?
支持非结构化数据 (略) 理,包括PDF文件、扫描文件和包含文字的图片的内容提取和表格化。识别精确度达到 * .9%以上。 1.3 可视化数据建模模块功能要求: ?
(略) 页、拖拽式、零代码的可视化数据建模能力。 ?
提供可视化模型训练的能力,支持主流且性能优异的分类、回归和聚类模型,包括逻辑回归模型、决策树模型、随机森林模型、梯度提升决策树模型、XGBoost模型、支持向量机模型、K近邻模型、 (略) 络模型、KMeans模型、高斯混合模型、聚合分层聚类模型、DBSCAN模型。 ?
对于每 * 类模型,支持指定不同的超参数,对于每 * 个超参数,还支持指定 * 系列值让系统选择最优的取值,即自动的超参数调优。 ?
支持用户查看树类的模型(决策树、随机森林、梯度提升决策树、XGBoost)中每棵树的结构。 ?
提供可视化模型测试的能力,支持多种模型测试和评估的方法,包括精确率、召回率、F1分数、混淆矩阵、成本矩阵、准确率、阈值决策图、ROC曲线图、密度分布曲线图。 1.4 可视化数据展示模块功能要求: ?
(略) 页、拖拽式、零代码的可视化数据展示能力。 ?
支持仪表盘功能,在同 * 个视图中集成多个图表,并按用户自定 (略) 排列组合。 ?
支持数据连接、图表编辑、仪表盘编辑、部署与更新的数据展示全流程覆盖。 2、
基于编程式的数据挖掘分析系统技术要求: 2.1编程式数据收集模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) 数据收集的能力。 ?
提供编程式数据爬取的能力,包括配置爬取规则(广度优先或深度优先)、配置URL满足条件、配置爬取内容、调度、下载、信息管道。 ?
提供编程式数据导入的能力,支持的数据源包括文本文件、Hive、SparkSQL、Impala、HBase、SQL数据库、Hadoop分布式文件系统、NoSQL数据库、云存储。 2.2 编 (略) 理模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) (略) 理的能力。 ?
支持描述性统计、单行计算操作、单列计算操作、字符串操作。 ?
(略) 理,包括插值、填充固定值。 ?
支持数据合并,包括级联、连接(内连接、左/右连接、全连接)、追加。 2.3 编程式数据建模模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) 数据建模的能力。 ?
提供编程式特征工程的能力,包括特征抽取、特征变换、无监督学习特征降维、有监督学习特征降维。 ?
支持特征哈希、文本特征抽取(词袋、向量化、Tf-idf权重)、图像特征抽取。 ?
提供编程式有监督模型训练的能力,支持的模型包括广义线性模型(岭回归、LASSO回归、 (略) 络、贝叶斯回归、逻辑回归、多项式回归)、线性和多项式判别分析、K近邻、支持向量机、朴素贝叶斯、决策树、集成模型(随机森林、AdaBoost、XGBoost、梯度提升树、投票分类器)、 (略) 络、多分类算法、半监督学习。 ?
提供编程式无监督模型训练的能力,支持的模型包括聚类(K-means、仿射传播、谱聚类、分层聚类、DBSCAN)、要素分解(主成分分析、字典学习、因子分析、独立成份分析、非负矩阵分解)、异常检测(椭圆边界、隔绝森林、局部异常因子)。 ?
提供编程式模型测试评估的能力,包括交叉验证(K折交叉验证、分层K折交叉验证、余 * 交叉验证、余K交叉验证、时间序列数据交叉验证)、超参数调优( (略) 格搜索、随机化超参数优化)、模型评估(准确率、混淆矩阵、汉明损失、Jaccard相似系数得分、精确率、召回率、F分数、对数损失、ROC曲线下面积、绝对误差均值、均方误差、均方对数误差、R方分数)、验证曲线(ROC曲线、学习曲线)。 2.4 编程式数据展示模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) 数据展示的能力。 ?
支持的图表包括等高线图、地理信息图、折线图、路径图、散点图、多边形图、柱状图、热力图、箱形图、分位数图。 ?
支持在绘制图表时做快速统计变换,包括计数、求和、密度分布、累计分布、分位数、平滑、去重。 ?
支持图表细节的调整,包括标签、标题、坐标轴范围、透明度、边框颜色、填充颜色、坐标轴标度(线性、对数、平方差)、坐标轴类型(日期、时间、离散)、线型、形状、大小。 支持多种图表坐标体系,包括笛卡尔坐标系、地图坐标系、极坐标系。 3、
大数据与人工智能科研平台管理模块要求: ?
提供管理和监控容器与虚拟机的能力,虚拟化平台与用户 * 期建设完成的数据挖掘与大数据分析实验平台虚拟化平台可以共享融通; ?
与用户 * 期建设完成的数据挖掘与大数据分析实验平台实现资源互通,即在已有的数据挖掘与大数据分析实验平台空闲时可无缝使用实训平台的计算资源; ?
与用户 * 期建设完成的数据挖掘与大数据分析实验平台实现案例互通,即实训平台中已有的案例和科研平台的案例能够实现同步和内容相互覆盖; ?
按用户管理资源上限,即单个用户能够申请的最大CPU数、内存和硬盘,如申请过度资源则拒绝; ?
用户资源超过指定期限自动销毁,支持用户有限次数的延长销毁期限,并在注册时就给与告知。在临近销毁时给予用户必要的倒计时提示; ?
支持宿主机管理,包括总体及分主机的内核数、磁盘、内存的总计使用情况; ?
支持容器与虚拟机管理,包括各容器与虚拟机的镜像、IP地址、配置、状态、电源状态、运行时间,并可以编辑、暂停、挂起、移植、重启、支持; ?
支持配置类型管理、镜像管理和、网络和路由管理; ?
提供管理和监控运算和存储资源的能力; ?
支持监控集群总体状态,包括CPU、磁盘IO、网络IO、HDFS IO; ?
支持核心服务的动态配置,包括配置HBase、HDFS、Hive、Hue、Impala、Oozie、Spark、YARN、Zookeeper; ?
支持集群诊断,实时查看事件和日志。 4、
大数据人工智能基础算法案例库要求: 提供在科研工作调用常用语言与数据挖掘算法模型的R语言与Python案例 ?
基本语法 ?
统计分析 ?
(略) 理 ?
特征工程 ?
分类算法 ?
关联规则分析 ?
聚类算法 ?
回归算法 ?
模型评估 ?
交叉验证 ?
参数调优 5、
数据分析实训课程要求: ?
Pyt (略) 数据爬取 ? HTTP基本原理 ?
(略) 页基础 ?
urllib基本数据爬取 ?
urllib高级数据爬取 ?
Cookie的使用 ?
(略) 理 ?
Python爬虫解析库的使用 ?
使用 (略) 页解析 ?
使用 (略) 页解析 ?
使用Beautiful S (略) 页 ?
使用PyQu (略) 页 ?
Python贝叶斯定理 ?
贝叶斯定理与统计推断 ?
贝叶斯估计与检验的比较 ?
Python贝叶斯多层和分层模型 ?
多层模型 ?
分层 * 项模型 ?
模型比较 ?
Python贝叶斯线性回归 ?
* 元线性回归 ?
多元线性回归 ?
分层线性回归 ?
Python贝叶斯逻辑回归 ?
逻辑回归基础 ?
多元逻辑回归 ?
Tableau数据可视化流程 ?
数据可视化基础 ?
连接数据源 ?
数据类型和角色 ?
创建视图 ?
标记卡 ?
页面和筛选器 ?
导出 ?
Tableau图表绘制 ?
文本表 ?
地图 ?
饼图 ?
条形图 ?
树状图 ?
折线图 ?
面积图 ?
组合图 ? 直方图 ?
散点图 ?
盒须图 ?
甘特图 ?
Tableau高级操作 ?
表计算 ?
计算字段 ?
常用函数 ?
参数 ?
Tableau仪表板和故事 ?
布局 ?
交互和动作 ?
故事 ?
数据分析报告撰写 ?
电子商务数据分析报告 ?
客户服务数据分析报告 ?
金融服务数据分析报告 ?
区块链课程 ?
Hyper Ledger Fab (略) 署 ?
区块链使用测试 ?
区块链浏览器使用 ?
智能合约开发 ?
(略) (略) ?
基于智能合约的拍卖 6、
科研综合实训案例要求: 6. (略) 业案例 ?
数据量: * 款以上新能源车数据; ?
知识点:商务数据分析,数据可视化, (略) 数据爬取; ?
数据字段:品牌、车型、纯电续航、慢充时间、快充时间、电池容量、最大功率、最大扭矩、月销量、年累计销量、月成交价、用户评分、 (略) 商指导价等; ?
分析流程: ?
数据收集:爬取新 (略) 页,通过CS (略) 页中感兴趣的信息; ?
可视化分析:市场占有率分析,品牌口碑分析,价格分析,续航分析,充电时间分析。 6.2 (略) 业案例 ?
数据量:超过 * 0个旅游景点数据; ?
知识点:商务数据分析,数据可视化,路径规划; ?
数据字段:景点、省份、地区、分类、开放时间、人均价格、联系方式、最佳时间、投诉电话、交通指南、图片、内容、经纬度等; ?
分析流程: ?
可视化分析:各省份和地区的景点分布、价格区间和类型特点; ?
旅游信息查询工具制作:根据省份、地区和分类智能获得景点信息; ?
旅游路线设计:根据选出的景点和景点的位置距离,智能规划出 (略) 有景点的最短路径。 6.3 (略) 业案例 ?
数据量:不少于 * 万个样本,每个样包含不少于7个属性。; ?
知识点:数据可视化,大数据; ?
数据字段:刷卡人、刷卡时间、地铁线、交通方式、价格和是否优惠等; ?
分析流程: ?
数据收集:从文件导入案例数据; ?
(略) 理:按分析维度做数据聚合; ?
可视化分析:站点客流分析,起止路径分析,时间变化趋势分析。 6. (略) (略) 业案例 ?
(略) 金融恶意用户分析案例,提供超过 * 万用户 * 多万条以上的金融数据。 ?
(略) 业用户注册 (略) 理 ? 基于注册时间的用户特征提取 ?
用户间关系模型分析 ?
(略) 区 (略) 动人分析 ?
分析流程 ?
数据收集:从文件导入案例数据; ?
(略) 理:用户信息的合并和借款还款历史数据集的合并,数据缺失值填充,特征选择; ?
可视化分析:借款逾期分布分析,年龄与月花销占月收入比例对借款逾期的影响; ?
数据建模:训练决策树和梯度提升机模型预测借款逾期。 6.5 (略) 业案例 ?
数据量:超过 * 万人的人口普查信息; ?
知识点:数据可视化,大数据; ?
数据字段:地理位置、年龄、收入、教育程度、性别、就业情况、学位 (略) 业等; ?
分析流程: ?
数据收集:从文件导入案例数据; ?
(略) 理:将字段编码转化为对应名称; ?
可视化分析:收入分析,失业分析。 质保及售后服务 1 质保期要求:5年内免费维护平台软件,免费升级平台管理模块和相关科研案例; 2 服务相应时间:质保期内2小时电话相应, * 小时上门服务, * 小时即时通讯工具的远程教学与指导, * 小时提供备机服务; 3 技术培训要求:厂商需要提供大数据与人工智能实训科研平台的使用培训、大数据与人工智能算法、实训课程以及综合案例的培训,培训时长不少于2天,次数不少于3次,培训人员需具备Cloudera (略) 技术支持工程师的技术证书; 4 安装交付要求:合同签订之日 * 天内完成系统安装调试,完成管理模块平台融通共享对接。本次采购的大数据与人工智能科研平台能够和前期 * 期建设的数据挖掘与大数据分析 (略) 数据互通对接服务,要求实训平台和科研平台的管理员、教师和学生账户、统计数据、设置和使用习惯可以互通,不需要重复创建和设置,前期 * 期建设的数据挖掘与大数据分析实验平台完成的项目案例可以直接转移到科研平台,科研平台的研究成果可以直接用于教学实训案例。
(略) - 竞价公告 (CB
点击查看>> ) 发布时间:
点击查看>> * : * : * 截止时间:
点击查看>> * : * : * 基本信息: 申购单号:CB
点击查看>> 申购主题:大数据与人工智能科研软件平台 采购单位: (略) 报价要求:国产含税 发票类型:增值税专用发票 币种:人民币 预算:
点击查看>>点击查看>> 签约时间:发布竞价结果后7天内签约合同 送货时间:合同签订后 * 天内送达 安装要求:免费上门安装(含材料费) 收货地址: (略) 省/ (略) 市/ (略) 区/
点击查看>>* 我要报价 付款方式:货到验收合格后付款 备注说明: 1 同类项目要求:竞价期间提供大数据与人工智能相关同类项目合同3份; 2 人员资质要求:竞价期间提供Cloudera (略) 技术支持工程师的技术证书; 3 竞价期间提供大数据人工智能实训科研平台相关软件著作权证书; 4 竞价期间提供大数据人工智能实训平台产品第 * 方测试报告; 5 竞价期间提供利用大数据与人工智能科研平台支撑过国家自然基金大数据人工智能相关项目的证明; 6 提供软件平台大数据与人工智能科研平台管理模块融通共享实施方案; 7 投标人作为中标候选人后, (略) 提供产品演示和试用, (略) 有参数达到要求,如果不能满足参数要求,则由后 * 个中标候选人中标,依次类推。 申购明细: 序号 1 采购内容 大数据与人工智能科研软件平台 数量 1套 预算单价 品牌 最新 型号 最新 规格参数 1、
基于可视化的数据挖掘分析系统 1.1 可视化数据采集模块功能要求: ?
(略) 页、拖拽式、零代码的可视化数据收集能力。 ?
提供可视化数据爬取的能力,支持登录验证、网页信息选择及下载、自动滚屏加载、 自动翻页的数据爬取全流程覆盖。 ?
提供可视化数据导入的能力,支持的数据源包括文本文件、SQL数据库、Hadoop分布式文件系统、NoSQL数据库、云存储。 ? 数据爬取时并发进程数不低于 * 个每秒,爬取性能不低于 * 个页面每秒。 ?
内置智能反爬引擎,每个爬取请求动态生成HTTP头,且能 (略) 为随机化爬取间隔、客户端浏览器信息等。 ?
能够配置爬取策略,至少包含深度优先搜索爬取和广度有限搜索爬取。 1.2 可 (略) 理模块功能要求: ?
(略) 页、拖拽式、零代码的可 (略) 理能力。 ?
提供可视化数据清洗和特征变换的能力,包括数据过滤、数据清洗、数据生成、数据变形、网络日志解析、地理信息解析。 ?
提供可视化数据聚合和连接的能力,可配置的项目包括分组变量、连接变量、聚合方法、连接方法(内连接、左/右连接、全连接)、输出变量。 ?
提供可视化特征工程的能力,包括特征选择、特征生成(线性组合、多项式组合)、特征降维(根据与目标变量的相关性、基于树类模型、主成分分析、基于LASSO回归模型)。 ?
提供可视化探索性数据分析的能力,支持抽取 * 定的样本,得到各变量的快速统计信息和数值分布。 ?
支持以图表的形式做探索性数据分析,图表以拖拽的方法得到,支持的图表类型包括折线图、柱状图、散点图、饼图、表格、地理信息图。 ?
支持非结构化数据 (略) 理,包括PDF文件、扫描文件和包含文字的图片的内容提取和表格化。识别精确度达到 * .9%以上。 1.3 可视化数据建模模块功能要求: ?
(略) 页、拖拽式、零代码的可视化数据建模能力。 ?
提供可视化模型训练的能力,支持主流且性能优异的分类、回归和聚类模型,包括逻辑回归模型、决策树模型、随机森林模型、梯度提升决策树模型、XGBoost模型、支持向量机模型、K近邻模型、 (略) 络模型、KMeans模型、高斯混合模型、聚合分层聚类模型、DBSCAN模型。 ?
对于每 * 类模型,支持指定不同的超参数,对于每 * 个超参数,还支持指定 * 系列值让系统选择最优的取值,即自动的超参数调优。 ?
支持用户查看树类的模型(决策树、随机森林、梯度提升决策树、XGBoost)中每棵树的结构。 ?
提供可视化模型测试的能力,支持多种模型测试和评估的方法,包括精确率、召回率、F1分数、混淆矩阵、成本矩阵、准确率、阈值决策图、ROC曲线图、密度分布曲线图。 1.4 可视化数据展示模块功能要求: ?
(略) 页、拖拽式、零代码的可视化数据展示能力。 ?
支持仪表盘功能,在同 * 个视图中集成多个图表,并按用户自定 (略) 排列组合。 ?
支持数据连接、图表编辑、仪表盘编辑、部署与更新的数据展示全流程覆盖。 2、
基于编程式的数据挖掘分析系统技术要求: 2.1编程式数据收集模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) 数据收集的能力。 ?
提供编程式数据爬取的能力,包括配置爬取规则(广度优先或深度优先)、配置URL满足条件、配置爬取内容、调度、下载、信息管道。 ?
提供编程式数据导入的能力,支持的数据源包括文本文件、Hive、SparkSQL、Impala、HBase、SQL数据库、Hadoop分布式文件系统、NoSQL数据库、云存储。 2.2 编 (略) 理模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) (略) 理的能力。 ?
支持描述性统计、单行计算操作、单列计算操作、字符串操作。 ?
(略) 理,包括插值、填充固定值。 ?
支持数据合并,包括级联、连接(内连接、左/右连接、全连接)、追加。 2.3 编程式数据建模模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) 数据建模的能力。 ?
提供编程式特征工程的能力,包括特征抽取、特征变换、无监督学习特征降维、有监督学习特征降维。 ?
支持特征哈希、文本特征抽取(词袋、向量化、Tf-idf权重)、图像特征抽取。 ?
提供编程式有监督模型训练的能力,支持的模型包括广义线性模型(岭回归、LASSO回归、 (略) 络、贝叶斯回归、逻辑回归、多项式回归)、线性和多项式判别分析、K近邻、支持向量机、朴素贝叶斯、决策树、集成模型(随机森林、AdaBoost、XGBoost、梯度提升树、投票分类器)、 (略) 络、多分类算法、半监督学习。 ?
提供编程式无监督模型训练的能力,支持的模型包括聚类(K-means、仿射传播、谱聚类、分层聚类、DBSCAN)、要素分解(主成分分析、字典学习、因子分析、独立成份分析、非负矩阵分解)、异常检测(椭圆边界、隔绝森林、局部异常因子)。 ?
提供编程式模型测试评估的能力,包括交叉验证(K折交叉验证、分层K折交叉验证、余 * 交叉验证、余K交叉验证、时间序列数据交叉验证)、超参数调优( (略) 格搜索、随机化超参数优化)、模型评估(准确率、混淆矩阵、汉明损失、Jaccard相似系数得分、精确率、召回率、F分数、对数损失、ROC曲线下面积、绝对误差均值、均方误差、均方对数误差、R方分数)、验证曲线(ROC曲线、学习曲线)。 2.4 编程式数据展示模块功能要求: ?
(略) 页的编辑器,支持调用常用数据挖掘 (略) 数据展示的能力。 ?
支持的图表包括等高线图、地理信息图、折线图、路径图、散点图、多边形图、柱状图、热力图、箱形图、分位数图。 ?
支持在绘制图表时做快速统计变换,包括计数、求和、密度分布、累计分布、分位数、平滑、去重。 ?
支持图表细节的调整,包括标签、标题、坐标轴范围、透明度、边框颜色、填充颜色、坐标轴标度(线性、对数、平方差)、坐标轴类型(日期、时间、离散)、线型、形状、大小。 支持多种图表坐标体系,包括笛卡尔坐标系、地图坐标系、极坐标系。 3、
大数据与人工智能科研平台管理模块要求: ?
提供管理和监控容器与虚拟机的能力,虚拟化平台与用户 * 期建设完成的数据挖掘与大数据分析实验平台虚拟化平台可以共享融通; ?
与用户 * 期建设完成的数据挖掘与大数据分析实验平台实现资源互通,即在已有的数据挖掘与大数据分析实验平台空闲时可无缝使用实训平台的计算资源; ?
与用户 * 期建设完成的数据挖掘与大数据分析实验平台实现案例互通,即实训平台中已有的案例和科研平台的案例能够实现同步和内容相互覆盖; ?
按用户管理资源上限,即单个用户能够申请的最大CPU数、内存和硬盘,如申请过度资源则拒绝; ?
用户资源超过指定期限自动销毁,支持用户有限次数的延长销毁期限,并在注册时就给与告知。在临近销毁时给予用户必要的倒计时提示; ?
支持宿主机管理,包括总体及分主机的内核数、磁盘、内存的总计使用情况; ?
支持容器与虚拟机管理,包括各容器与虚拟机的镜像、IP地址、配置、状态、电源状态、运行时间,并可以编辑、暂停、挂起、移植、重启、支持; ?
支持配置类型管理、镜像管理和、网络和路由管理; ?
提供管理和监控运算和存储资源的能力; ?
支持监控集群总体状态,包括CPU、磁盘IO、网络IO、HDFS IO; ?
支持核心服务的动态配置,包括配置HBase、HDFS、Hive、Hue、Impala、Oozie、Spark、YARN、Zookeeper; ?
支持集群诊断,实时查看事件和日志。 4、
大数据人工智能基础算法案例库要求: 提供在科研工作调用常用语言与数据挖掘算法模型的R语言与Python案例 ?
基本语法 ?
统计分析 ?
(略) 理 ?
特征工程 ?
分类算法 ?
关联规则分析 ?
聚类算法 ?
回归算法 ?
模型评估 ?
交叉验证 ?
参数调优 5、
数据分析实训课程要求: ?
Pyt (略) 数据爬取 ? HTTP基本原理 ?
(略) 页基础 ?
urllib基本数据爬取 ?
urllib高级数据爬取 ?
Cookie的使用 ?
(略) 理 ?
Python爬虫解析库的使用 ?
使用 (略) 页解析 ?
使用 (略) 页解析 ?
使用Beautiful S (略) 页 ?
使用PyQu (略) 页 ?
Python贝叶斯定理 ?
贝叶斯定理与统计推断 ?
贝叶斯估计与检验的比较 ?
Python贝叶斯多层和分层模型 ?
多层模型 ?
分层 * 项模型 ?
模型比较 ?
Python贝叶斯线性回归 ?
* 元线性回归 ?
多元线性回归 ?
分层线性回归 ?
Python贝叶斯逻辑回归 ?
逻辑回归基础 ?
多元逻辑回归 ?
Tableau数据可视化流程 ?
数据可视化基础 ?
连接数据源 ?
数据类型和角色 ?
创建视图 ?
标记卡 ?
页面和筛选器 ?
导出 ?
Tableau图表绘制 ?
文本表 ?
地图 ?
饼图 ?
条形图 ?
树状图 ?
折线图 ?
面积图 ?
组合图 ? 直方图 ?
散点图 ?
盒须图 ?
甘特图 ?
Tableau高级操作 ?
表计算 ?
计算字段 ?
常用函数 ?
参数 ?
Tableau仪表板和故事 ?
布局 ?
交互和动作 ?
故事 ?
数据分析报告撰写 ?
电子商务数据分析报告 ?
客户服务数据分析报告 ?
金融服务数据分析报告 ?
区块链课程 ?
Hyper Ledger Fab (略) 署 ?
区块链使用测试 ?
区块链浏览器使用 ?
智能合约开发 ?
(略) (略) ?
基于智能合约的拍卖 6、
科研综合实训案例要求: 6. (略) 业案例 ?
数据量: * 款以上新能源车数据; ?
知识点:商务数据分析,数据可视化, (略) 数据爬取; ?
数据字段:品牌、车型、纯电续航、慢充时间、快充时间、电池容量、最大功率、最大扭矩、月销量、年累计销量、月成交价、用户评分、 (略) 商指导价等; ?
分析流程: ?
数据收集:爬取新 (略) 页,通过CS (略) 页中感兴趣的信息; ?
可视化分析:市场占有率分析,品牌口碑分析,价格分析,续航分析,充电时间分析。 6.2 (略) 业案例 ?
数据量:超过 * 0个旅游景点数据; ?
知识点:商务数据分析,数据可视化,路径规划; ?
数据字段:景点、省份、地区、分类、开放时间、人均价格、联系方式、最佳时间、投诉电话、交通指南、图片、内容、经纬度等; ?
分析流程: ?
可视化分析:各省份和地区的景点分布、价格区间和类型特点; ?
旅游信息查询工具制作:根据省份、地区和分类智能获得景点信息; ?
旅游路线设计:根据选出的景点和景点的位置距离,智能规划出 (略) 有景点的最短路径。 6.3 (略) 业案例 ?
数据量:不少于 * 万个样本,每个样包含不少于7个属性。; ?
知识点:数据可视化,大数据; ?
数据字段:刷卡人、刷卡时间、地铁线、交通方式、价格和是否优惠等; ?
分析流程: ?
数据收集:从文件导入案例数据; ?
(略) 理:按分析维度做数据聚合; ?
可视化分析:站点客流分析,起止路径分析,时间变化趋势分析。 6. (略) (略) 业案例 ?
(略) 金融恶意用户分析案例,提供超过 * 万用户 * 多万条以上的金融数据。 ?
(略) 业用户注册 (略) 理 ? 基于注册时间的用户特征提取 ?
用户间关系模型分析 ?
(略) 区 (略) 动人分析 ?
分析流程 ?
数据收集:从文件导入案例数据; ?
(略) 理:用户信息的合并和借款还款历史数据集的合并,数据缺失值填充,特征选择; ?
可视化分析:借款逾期分布分析,年龄与月花销占月收入比例对借款逾期的影响; ?
数据建模:训练决策树和梯度提升机模型预测借款逾期。 6.5 (略) 业案例 ?
数据量:超过 * 万人的人口普查信息; ?
知识点:数据可视化,大数据; ?
数据字段:地理位置、年龄、收入、教育程度、性别、就业情况、学位 (略) 业等; ?
分析流程: ?
数据收集:从文件导入案例数据; ?
(略) 理:将字段编码转化为对应名称; ?
可视化分析:收入分析,失业分析。 质保及售后服务 1 质保期要求:5年内免费维护平台软件,免费升级平台管理模块和相关科研案例; 2 服务相应时间:质保期内2小时电话相应, * 小时上门服务, * 小时即时通讯工具的远程教学与指导, * 小时提供备机服务; 3 技术培训要求:厂商需要提供大数据与人工智能实训科研平台的使用培训、大数据与人工智能算法、实训课程以及综合案例的培训,培训时长不少于2天,次数不少于3次,培训人员需具备Cloudera (略) 技术支持工程师的技术证书; 4 安装交付要求:合同签订之日 * 天内完成系统安装调试,完成管理模块平台融通共享对接。本次采购的大数据与人工智能科研平台能够和前期 * 期建设的数据挖掘与大数据分析 (略) 数据互通对接服务,要求实训平台和科研平台的管理员、教师和学生账户、统计数据、设置和使用习惯可以互通,不需要重复创建和设置,前期 * 期建设的数据挖掘与大数据分析实验平台完成的项目案例可以直接转移到科研平台,科研平台的研究成果可以直接用于教学实训案例。
43