一种医学文档专业词汇自动化标注方法

内容
 
发送至邮箱

一种医学文档专业词汇自动化标注方法

一种医学文档专业词汇自动化标注方法
1
面议 (略) 市辖区
A 电子信息技术
本发明涉及一种医学文档专业词汇自动化标注方法,包括:对输入的医学文档进行数据预处理,得到预处理后的医学文档文本;获取词的字母级特征向量、单词级特征向量、语言特征向量并进行融合,作为词的编码向量;将分词后的医学文档文本的词标注分类得到标注数据集;对每一个词输出一个多维向量作为词的空间表示;获取增强后的标注数据集;进行训练建模,并最终输出标注结果。本发明设计合理,其采用半监督学习算法对大量未标注数据进行标注,成功地克服了现有医疗行业标注数据过少的缺陷,有效地提高了模型能够使用的数据量,并大幅提升算法对于关键词和专业词汇的标注准确率,可广泛用于医疗文献处理中。
序号 专利名称 专利号 专利类型 专利权人或申请人 法律状态
1 一种医学文档专业词汇自动化标注方法 ZL*.3 发明 天津科技大学 null
序号 软件名称 著作权人 登记号
序号 步图设计名称 登记号 步图设计权利人
序号 新品种名称 品种权号 品种权人
序号 药品名称 证书编号 持有者
序号 品种名称 证书编号 育种者
序号 产品名称 证书号 申请单位 中药保护品种等级
序号 产品名称 注册证编号 注册人名称
序号 商标名称 注册号 注册人 注册人 核定使用商品类别
序号 名称
交易部
杨丽宇 *
苏经理 0311-*
一种医学文档专业词汇自动化标注方法
1
面议 (略) 市辖区
A 电子信息技术
本发明涉及一种医学文档专业词汇自动化标注方法,包括:对输入的医学文档进行数据预处理,得到预处理后的医学文档文本;获取词的字母级特征向量、单词级特征向量、语言特征向量并进行融合,作为词的编码向量;将分词后的医学文档文本的词标注分类得到标注数据集;对每一个词输出一个多维向量作为词的空间表示;获取增强后的标注数据集;进行训练建模,并最终输出标注结果。本发明设计合理,其采用半监督学习算法对大量未标注数据进行标注,成功地克服了现有医疗行业标注数据过少的缺陷,有效地提高了模型能够使用的数据量,并大幅提升算法对于关键词和专业词汇的标注准确率,可广泛用于医疗文献处理中。
序号 专利名称 专利号 专利类型 专利权人或申请人 法律状态
1 一种医学文档专业词汇自动化标注方法 ZL*.3 发明 天津科技大学 null
序号 软件名称 著作权人 登记号
序号 步图设计名称 登记号 步图设计权利人
序号 新品种名称 品种权号 品种权人
序号 药品名称 证书编号 持有者
序号 品种名称 证书编号 育种者
序号 产品名称 证书号 申请单位 中药保护品种等级
序号 产品名称 注册证编号 注册人名称
序号 商标名称 注册号 注册人 注册人 核定使用商品类别
序号 名称
交易部
杨丽宇 *
苏经理 0311-*
    
查看详情》
相关推荐
 

招投标大数据

查看详情

收藏

首页

最近搜索

热门搜索