SIA OpenIR  > 数字工厂研究室
基于词向量的评价搭配抽取算法研究
其他题名Research on the Algorithm of Evaluation Collocation Extraction Based on Word Vector
杨令铎; 史海波; 周晓锋
作者部门数字工厂研究室
关键词搭配抽取 词向量 神经网络 条件随机域 最大熵
发表期刊小型微型计算机系统
ISSN1000-1220
2016
卷号37期号:10页码:2269-2272
收录类别CSCD
CSCD记录号CSCD:5833022
产权排序1
资助机构国家“八六三”高技术研究发展计划项目(2013AA040705-1)资助
摘要传统中文评价搭配抽取采用的最大熵和条件随机域等算法依赖于人工选取特征,且对前期语义标注精度要求较高.本文提出一种使用词向量代替传统语义特征进行搭配抽取的方法.其中词向量通过深度学习模型在大规模语料上进行无监督学习得到.实验中将词向量及语义特征分别作为三种机器学习模型的输入,结果表明使用词向量在神经网络模型中取得了较好的效果,其精度、召回率都比使用语义特征最好情况高出接近3%,同时,我们发现随着无监督学习训练语料的增大,得到的词向量也越来越实用.
其他摘要Maximum entropy and conditional random field or other algorithms used for collocation extraction in the traditional assessment of Chinese language rely on manual selection of characteristics and have a high demand for semantics marking precision at the preliminary stage. In this paper,an alternative approach is suggested which substitutes term vector for the traditional semantic characteristics in collocation extracting. Specifically,the term vectors are acquired by an in-depth model completing unsupervised learning from a large corpus. In testing,the term vectors and the semantic characteristics are separately entered as inputs into three machine learning models. The results indicate that better outcomes are produced when term vectors are used in the neural network model in the sense that both the precision and recall rate are higher by nearly 3% than the best outcomes that are achievable with semantic characteristics. We also note that as the size of the corpus used for unsupervised learning training increases the resulting term vectors become more and more pragmatic.
语种中文
引用统计
文献类型期刊论文
条目标识符http://ir.sia.cn/handle/173321/19398
专题数字工厂研究室
通讯作者杨令铎
作者单位1.中国科学院物联网研究发展中心
2.中国科学院沈阳自动化研究所
3.无锡中科泛在技术研发中心有限公司
推荐引用方式
GB/T 7714
杨令铎,史海波,周晓锋. 基于词向量的评价搭配抽取算法研究[J]. 小型微型计算机系统,2016,37(10):2269-2272.
APA 杨令铎,史海波,&周晓锋.(2016).基于词向量的评价搭配抽取算法研究.小型微型计算机系统,37(10),2269-2272.
MLA 杨令铎,et al."基于词向量的评价搭配抽取算法研究".小型微型计算机系统 37.10(2016):2269-2272.
条目包含的文件 下载所有文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于词向量的评价搭配抽取算法研究.pdf(248KB)期刊论文作者接受稿开放获取ODC PDDL浏览 下载
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[杨令铎]的文章
[史海波]的文章
[周晓锋]的文章
百度学术
百度学术中相似的文章
[杨令铎]的文章
[史海波]的文章
[周晓锋]的文章
必应学术
必应学术中相似的文章
[杨令铎]的文章
[史海波]的文章
[周晓锋]的文章
相关权益政策
暂无数据
收藏/分享
文件名: 基于词向量的评价搭配抽取算法研究.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。