典型文献
面向特定领域中文阅读理解数据集研究
文献摘要:
机器阅读理解旨在训练模型使其拥有理解自然语言并回答问题的能力,以便于以较低的人力解决现实世界中的问题.该文提出了一种面向特定领域(餐饮行业)的中文阅读理解数据集——Restaurant(Res).该数据集的初始数据来自大众点评应用程序,以餐饮行业的用户评论为初始文本,标注者在此基础上提出问题并给出答案.目前Res数据集有两个版本,Res_v1中所有问题的答案都可以在用户评论中找到,Res_v2在Res_v1的基础上增加评论中没有答案的问题,进一步契合现实场景.该文在此数据集上应用主流的BiDAF、QANet和Bert模型进行实验,实验结果显示该数据集上最高的准确率只有73.78%,相比于人类接近91.03% 的正确率仍有较大差距.
文献关键词:
机器阅读理解;自由问答;自然语言处理
中图分类号:
作者姓名:
孙越凡;杨亮;林原;许侃;林鸿飞
作者机构:
大连理工大学信息检索研究室,辽宁大连116000
文献出处:
引用格式:
[1]孙越凡;杨亮;林原;许侃;林鸿飞-.面向特定领域中文阅读理解数据集研究)[J].中文信息学报,2022(12):44-51
A类:
BiDAF,QANet,自由问答
B类:
特定领域,中文阅读,解数,机器阅读理解,训练模型,有理解,答问,现实世界,餐饮行业,Restaurant,自大,大众点评,应用程序,用户评论,提出问题,v1,v2,现实场景,Bert,自然语言处理
AB值:
0.290489
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。