首站-论文投稿智能助手
典型文献
司法机器阅读理解的优化策略研究
文献摘要:
针对司法领域阅读理解数据集缺乏、现有模型在不可回答问题样本和噪声样本上表现不佳等问题,提出了三种优化策略.首先,采用通用领域阅读理解数据集对RoBERTa-wwm模型进行预训练;然后,采用基于UniLM的问句生成模型生成不可回答问题样本,扩充已有训练集;最后,在微调阶段采用对抗训练算法对模型进行优化,增强模型的鲁棒性.在CJRC数据集上的实验结果表明:本文优化方法相比基线模型F1值提高了5%,并且在小样本情况下具有优异的表现.
文献关键词:
司法阅读理解;RoBERTa-wwm;问题生成;对抗训练;迁移学习
作者姓名:
秦永彬;黄辉;王凯
作者机构:
贵州大学 计算机科学与技术学院,贵州 贵阳 550025;贵州大学 公共大数据重点实验室,贵州 贵阳 550025
引用格式:
[1]秦永彬;黄辉;王凯-.司法机器阅读理解的优化策略研究)[J].华中科技大学学报(自然科学版),2022(02):142-148
A类:
CJRC,司法阅读理解
B类:
机器阅读理解,优化策略研究,司法领域,解数,现有模型,答问,RoBERTa,wwm,预训练,UniLM,问句,生成模型,模型生成,训练集,微调,对抗训练,训练算法,增强模型,比基,基线模型,小样本,问题生成,迁移学习
AB值:
0.421461
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。