典型文献
基于子词的化学术语嵌入表示研究
文献摘要:
针对基于词嵌入模型不能准确表征低频化学术语嵌入的问题,提出了基于子词的化学术语嵌入表示方法,以提高低频化学术语嵌入表示的准确性.首先,引入化学术语词典,利用字节对编码方法,自动生成子词词表;其次,根据生成的子词词表,对化学术语进行编码,使用子词表示化学术语;最后,利用改进的词嵌入模型训练相关文本语料,根据子词嵌入计算化学术语嵌入,最终得到化学术语嵌入表示.实验结果表明,与已有的方法相比,方法能够有效地提高化学术语嵌入表示的准确性,特别是低频化学术语嵌入表示的准确性.
文献关键词:
化学术语;嵌入表示;子词
中图分类号:
作者姓名:
孙瑜;史普润
作者机构:
江苏大学计算机科学与通信工程学院 江苏镇江 212013;南京航空航天大学经济与管理学院 江苏南京 210016
文献出处:
引用格式:
[1]孙瑜;史普润-.基于子词的化学术语嵌入表示研究)[J].信息技术与信息化,2022(07):50-57
A类:
化学术语
B类:
子词,嵌入表示,词嵌入模型,表示方法,高低频,术语词典,用字,字节对编码,编码方法,自动生成,词表,模型训练,语料,计算化学
AB值:
0.162285
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。