融合类别先验Mixup数据增强的罪名预测方法 | |
线岩团; 陈文仲; 余正涛; 张亚飞; 王红斌 | |
刊名 | 自动化学报 |
2022 | |
卷号 | 48期号:8页码:2097-2107 |
关键词 | 类别先验Mixup 罪名预测 类别不平衡分类 低频罪名 |
ISSN号 | 0254-4156 |
DOI | 10.16383/j.aas.c200908 |
英文摘要 | 罪名预测是人工智能技术应用于司法领域的代表性任务.该任务根据案情描述和事实预测被告人被判的罪名.由于各类罪名样本数量高度不平衡,分类模型训练时分类器易偏向高频罪名类别,从而导致低频罪名预测性能不佳.针对罪名预测类别不平衡问题,提出融合类别先验Mixup数据增强策略的罪名预测模型,改进低频罪名预测效果.该模型利用双向长短期记忆网络与结构化自注意力机制学习文本向量表示,在此基础上,通过Mixup数据增强策略在向量表示空间中合成伪样本,并利用类别先验使合成样本的标签偏向低频罪名类别,以此来扩增低频罪名训练样本.实验结果表明,与现有方法相比,该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升,低频罪名预测的宏F1值提升达到13.5%. |
内容类型 | 期刊论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/56312] |
专题 | 自动化研究所_学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 线岩团,陈文仲,余正涛,等. 融合类别先验Mixup数据增强的罪名预测方法[J]. 自动化学报,2022,48(8):2097-2107. |
APA | 线岩团,陈文仲,余正涛,张亚飞,&王红斌.(2022).融合类别先验Mixup数据增强的罪名预测方法.自动化学报,48(8),2097-2107. |
MLA | 线岩团,et al."融合类别先验Mixup数据增强的罪名预测方法".自动化学报 48.8(2022):2097-2107. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论