CORC  > 自动化研究所  > 中国科学院自动化研究所  > 学术期刊  > 自动化学报
融合类别先验Mixup数据增强的罪名预测方法
线岩团; 陈文仲; 余正涛; 张亚飞; 王红斌
刊名自动化学报
2022
卷号48期号:8页码:2097-2107
关键词类别先验Mixup 罪名预测 类别不平衡分类 低频罪名
ISSN号0254-4156
DOI10.16383/j.aas.c200908
英文摘要罪名预测是人工智能技术应用于司法领域的代表性任务.该任务根据案情描述和事实预测被告人被判的罪名.由于各类罪名样本数量高度不平衡,分类模型训练时分类器易偏向高频罪名类别,从而导致低频罪名预测性能不佳.针对罪名预测类别不平衡问题,提出融合类别先验Mixup数据增强策略的罪名预测模型,改进低频罪名预测效果.该模型利用双向长短期记忆网络与结构化自注意力机制学习文本向量表示,在此基础上,通过Mixup数据增强策略在向量表示空间中合成伪样本,并利用类别先验使合成样本的标签偏向低频罪名类别,以此来扩增低频罪名训练样本.实验结果表明,与现有方法相比,该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升,低频罪名预测的宏F1值提升达到13.5%.
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/56312]  
专题自动化研究所_学术期刊_自动化学报
推荐引用方式
GB/T 7714
线岩团,陈文仲,余正涛,等. 融合类别先验Mixup数据增强的罪名预测方法[J]. 自动化学报,2022,48(8):2097-2107.
APA 线岩团,陈文仲,余正涛,张亚飞,&王红斌.(2022).融合类别先验Mixup数据增强的罪名预测方法.自动化学报,48(8),2097-2107.
MLA 线岩团,et al."融合类别先验Mixup数据增强的罪名预测方法".自动化学报 48.8(2022):2097-2107.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace