1、技术路线要求 1.1、语音识别技术 语音识别引擎提供关键字语音识别和连续语音识别,具备优秀的识别率,提供全面的开发支持及丰富的工具,易于使用。 1.2、自然语言处理及大数据分析 对采集到的海量医疗数据进行分析存在许多挑战。首先,医疗信息系统通常不是为了科研和数据分析设计的。从数据分析的角度看,医疗数据通常比较复杂,数据的异构度较大,存在很多缺失信息和不一致信息。其次,理解医疗数据通常需要不同领域的知识,包括医学,生物统计学,流行病学和信息学等。在某些涉及基因疗法的医学数据中,还需要有基因学背景领域专家。医学术语和本体知识库医学术语提供了标准化描述并减少歧义的医学术语,而医学本体知识库进一步提供了标准化且一致的医学本体词汇来描述医学概念和概念之间的关系。通过使用医学术语和本体知识库,复杂、异构的医疗数据之间可以相互交流,使后续的科学分析得以进行。 1.3 、语音内容理解与摘要 针对语音转写结果基础上的内容理解及摘要,采用的技术路线为: (1)语音转写结果的可读性提升 计划使用基于多信息融合及基于声学属性识别的声学置信度技术,并结合语义信息,进一步提升异常语音的检测能力;计划研究基于CRF(Conditional Random Field)模型的标点技术、基于CRF模型的句子顺滑及基于最大熵模型的关键信息抽取等技术,通过这些技术的组合,进一步改善转写内容的可阅读性。 (2)语义段落的自动划分 基于句子级别语义聚类和关联逻辑关系的分析,以及一些特殊的提示型词汇、停顿长度等额外信息,自动将较长的内容转写结果切分为语义相对独立的若干个段落,为关键信息和摘要做准备; (3)语义摘要 借鉴传统的文本自动摘要,并根据语音中说话人、语气强调重复等信息,自动对每一段语音进行关键信息的抽取和自动摘要。 1.4、云计算技术 为了满足医疗信息化发展需要,在大用户量、高访问率的前提下保证系统的高可用性、高可靠性,建议采用云计算的技术路线,云计算是在分布式计算、并行计算、网络存储、负载均衡的基础上,进一步融合了虚拟化、效用计算等技术,建立了IT基础设施资源池,实现了应用和存储的动态分配、调度和高效利用。 云计算需具有按需使用、随时扩展、易于管理、安全可靠、共享资源的优点。云计算将所有的计算资源集中起来,并由软件实现自动管理。与此同时,云计算可以跨越异构、动态流转的资源池为客户提供可自治的服务,实现资源的按需分配,提高信息化建设的效率和弹性,有利于促进医疗生产活动的集约化水平和降低成本。 2建设需求 2.1 AI能力平台技术参数要求 序号 | 类别 | 模块名称 | 功能需求 | 1 | 医学AI能力平台 | 医疗语音识别服务 | 支持中文连续语音听写识别,标准或带口音普通话的免切换; | 2 | 支持中英文混合听写,提供中文中混读少量的英文听写功能; | 3 | 支持按数字串或数值读多种方式的听写识别功能; | 4 | 提供标点智能预测和口述标点相结合方式; | 5 | ▲支持短语音(<60s)和连续超长语音(>3h)识别功能; | 6 | 支持带低噪音频的听写识别功能; | 7 | 支持对语音停止间隔进行参数配置,满足不同场景需求; | 8 | 支持文本规范化处理,如字母大小写、数字串、医学单位符号规整等; | 9 | 支持服务端语音识别服务API和SDK调用,接口支持android以及windows 系统; | 10 | 医学AI能力平台中文语音识别准确率达到96%及以上(提供第三方机构检测报告复印件) | 11 | 自然语言理解 | 用户通过填写技能名称、技能标识等完成技能创建,基于技能创建意图,进行意图编辑、测试验证等功能应用; | 12 | 可以从外部平台或服务器上下载技能,批量导入到本地平台; | 13 | 支持技能编辑、技能删除、单个技能下载和批量选中后下载等维护功能; | 14 | 用户通过填写意图名称、意图标识等完成创建,意图标识不可更改,创建完成后即可基于意图添加语料,进行语料结构化、技能构建、测试验证等功能应用; | 15 | 支持意图的字段编辑、意图删除、单个意图查询功能; | 16 | 支持让机器理解用户意图的自然语言回答,具体包括:语料、实体、只能贴弧等功能; | 17 | 支持提示意图是否完成构建,待验证语料是否包含非法字符,并对已完成构建的意图进行验证测试; | 18 | 支持填写实体名称、实体标识、描述及内容词条来完成创建; | 19 | 支持自建实体内容的编辑、删除、查询; | 20 | 关键信息提取KIE服务 | 预处理:对输入病历文本进行分句和内容规整; | 21 | 结构化:对输入病历文本中的关系进行抽取; | 22 | 后处理:多方案结果融合规整,输出最终结构化病历信息; | 23 | 支持KIE服务的接口调用; | 24 | 语音合成 | 实时将文字信息转化为声音信息,给应用配上“嘴巴”; | 25 | 支持多个医疗定制发音人(默认提供2个女声和1个男声),满足多场景合成播报需要; | 26 | 提供多档语速配置,支持在语音合成时,灵活改变语音播放速度; | 27 | 提供多档音量配置,支持在语音合成时,灵活控制音量的大小; | 28 | 支持中英文文本的混合播报; | 29 | 支持用户自定义发音词典、停顿优化等参数设置的标记语言; | 30 | 支持语音合成服务接口调用; | 31 | 医学AI能力平台中英文语音合成自然度达到4.3分及以上(提供第三方机构检测报告复印件) | 32 | 医疗OCR服务 | 支持对图片格式进行处理,具体包括对原始图片数据格式进行转换、歪斜校正等; | 33 | 提供印刷体识别、表格切分和识别等功能,实现图片的精准识别成文字; | 34 | 支持病历报告的识别并封装成结构化处理服务,具体包括检查单类、检验单类、门诊病历、出院小结、医保费用清单; | 35 | 支持报告需要提取的字段内容进行维护管理; | 36 | 提供接口服务以及上层业务解析功能的封装开发包; | 37 | 医疗语音输入系统 | 功能要求 | 支持标准和口音普通话的语音输入功能; | 38 | 客户端支持私有云或公有云语音识别服务的配置; | 39 | 支持特殊符号点选输入,并对最近符号进行置顶显示; | 40 | ▲提供音频转写功能,可直接对音频文件进行转写识别; | 41 | 软件支持四麦台式降噪麦克风,并可对麦克风进行联动操作和设置; | 42 | 软件支持智能控制鼠标,鼠标按键可控制语音录入功能的启停; | 43 | ▲支持用户级个性化的热词和替换列表,可实时生效,提高系统语音识别率; | 44 | 支持各种医学专有名词、医学常用计量单位、医学专有特殊符号、医学专用中英文混合单词、医学专有英文简称、罗马数字、希腊字母识别,支持英文单词大小写区分; | 45 | 支持数字串自动规整功能,可以准确识别日期、血压、脉搏等阿拉伯数字; | 46 | 支持识别文本内容的顺滑,自动过滤语气词等无意义内容; | 47 | 支持语音控制光标跳转功能,包括回车、换行、删除; | 48 | ▲支持多应用时的光标锁定功能。用户可通过语音及鼠标控制锁定光标,多窗口操作时仍能正常进行语音录入; | 49 | ▲支持语音唤醒功能,可使用记录和结束等词控制需要上屏的语音文本; | 50 | ▲支持场景小包功能,内置5种场景:口腔、放射、超声、病理、中医。; | 51 | ▲支持本地离线识别,在断网情况下,可以进行简单纯中文语音识别录入功能 | 52 | ▲支持输入法浅对接,可满足C++\C#\PB\Delphi语言开发的门诊系统的集成调用,支持指令控制。 | 53 | 性能要求 | 医疗输入法客户端,支持 Windows(XP 及以上)操作系统; | 54 | 医疗语音识别平均正确率达 96%以上,场景深度定制优化后可达97%以上; | 55 | 单客户端网络带宽限速在 30Kb/s 无延迟抖动情况下,语音识别处理的子句延迟时间小于 0.8s。 | 56 | 硬件 | 多模态输入 台式麦克风要求 | ▲采用四麦克风阵列,可实现多方位拾音采样; | 57 | 采用专业降噪算法,可实现一定距离外降噪拾音; | 58 | ▲支持触摸感应发言开关,轻触即可点亮使用 | 59 | 采用标准 USB2.0 接口供电和数据传输, 自动安装驱动, 轻松完成与 PC 连接; | 60 | 麦克风设有防菌处理, 可有效防止细菌繁染; | 61 | 供电接口: USB 接口; | 62 | 供电需求: 5V/500mA; | 63 | 系统兼容XP、win7、win10 | 64 | 频率响应: 20Hz-8KHz; | 65 | 信噪比: ≥60dB A+(1kHz线路); | 66 | 指向性: 全指向 MIC,通过算法实现降噪和指向; | 67 | 灵敏度:: -44±3dB/1V/Pa(at 1kHz) | 68 | 多模态输入 智能控制鼠标要求 | ▲提供语音录入控制功能,鼠标按键可直接对输入客户端进行启停控制; | 69 | 具有录音模式控制功能,支持左侧按键按住说话或点击说话两种模式; | 70 | 供电接口: USB 接口; | 71 | 数据接口: USB2.0; | 72 | 系统兼容: XP、 Win7、 WinVista、 Win8、 Win10; | 73 | 按键寿命:不低于 1000 万次。 | 3、其他需求 3.1、项目周期 本项目要求在2个月内完成。 3.2、项目实施 建立项目工作组 提供本项目组织结构图,说明各角色的职责、人员姓名、人员数量,包括: (1)项目经理:具有本科学历,并全权代表供应商执行各项技术及管理工作; (2)项目实施人员:项目签约后,供应商保证须提供常驻项目实施人员在现场工作,直至项目结束。 (3)项目管理与上线支持人员:系统上线期间,供应商保证须提供项目管理与上线支持人员,人员须为供应商正式员工。 未经采购人同意供应商不得调整在响应文件中所承诺的项目实施人员,否则供应商赔偿由此给采购人造成的全部损失。 根据项目质量和进度的需要,供应商应及时充实项目管理人员和技术实施人员。供应商必须无条件接受采购人任何形式的监督检查,并承担因其人员不足、不到位所导致影响项目质量、进度的违约责任。 项目实施交付和验收要求 (1)按照合同规定的时间提交产品,并在实施现场以双方认可的方式进行安装; (2)系统实施验收按照合同计划进行,须在验收时完成各应用模块完成实施功能确认。 (3)验收人员由医院相关人员、供应商共同组成,验收标准按验收规范,并以系统稳定运行为前提。系统验收前,由供应商按系统分析文档和系统设计文档提供测试工具与数据对各模块、子系统测试,测试结果双方主管人员签字认可,存档留作验收时参考; (4)系统验收后成交供应商须保证提供详细的相关技术服务文档(含数据结构、数据流图、系统字典说明等)、使用说明书、维护手册等文档资料及其电子版。 2.3、项目文档 文档是保证项目实施连贯性的重要保证,供应商需要提供完善的文档,并对项目进行过程中的文档进行有效的管理,接受招标人对项目各阶段评估分析和监督管理。 整个项目的过程包括后期修改维护提供系统、完整的项目管理、设计和开发、操作说明等书面文档及其电子版。 供应商须根据实施进度及时提供相关文档(电子文档、纸质文档),文档应有严格的版本控制策略,最终交付的文档必须是最新的,软件技术描述需包含但不局限以下文档: 准备阶段:《项目实施方案》; 测试阶段:《测试计划》、《测试记录》、《测试报告》; 上线阶段:《试运行/上线计划》、《试运行/上线报告》; 过程文档:《培训计划》、《培训记录》、《例会记录》; 交付使用:《用户手册》、《安装维护手册》、产品使用说明书等; 其他文档:《售后服务规范》及按采购文件要求须提供的其它文档,数据结构说明、安装程序以及相关外部接口文档和参数文档;已安装的设备明细表、调试记录、竣工图(网络拓扑图)、施工随工记录/施工日志、设计变更、洽商记录(若发生)、停(复)工通知单;(如发生)交工验收记录等。所有的技术文件须用中文书写。 2.4、系统培训 对本项目相关的具体人员进行专业的培训,技术培训分为课程培训和现场培训。应在进行培训之前向采购人提交一份详细的培训计划。供应商应按采购人要求安排培训。内容应包括所投产品的相关使用培训、运维管理培训计系统开发培训等内容。免费维护期内, 应至少有一次培训。 培训计划内容应完整、规范、实用、合理,培训内容应覆盖项目全部内容、相关人员、能很好的支撑项目服务。供应商必须为所有被培训人员提供培训用文字资料和讲义等相关用品,所有培训资料和讲义必须有中文版本。所有的场地、交通、培训费用包含在投标总价内。 确保参培人员达到以下要求: 1、维护人员经过培训后,可熟练使用应用系统软件,独立完成硬件日常维护工作,能够掌握系统运行情况以及及时排除系统故障。 2、系统管理员经过培训后,可以掌握系统软件和应用软件的使用,熟悉系统整体结构,能够独立阅读分析并处理系统故障,管理系统设备。 |