2021全球开放数据应用创新大赛-法律咨询问答亚军方案

赛题分析

任务:给定用户问题,根据多个候选答案生成回复,属于文本生成任务。

问题信用逾期了,银行打电话骚扰我父母,改如何处理
候选答案1. 按照约定还款 2.报警
标准回复你好,这种情况只能按照约定还款,如果构成骚扰可以去报警处理。

评价指标:使用jieba工具分词;采用ROUGE指标(N是n-gram中的n,取 值1,2)和ROUGE-L作为评价指标。
f − s c o r e = 0.2 ∗ f − s c o r e ( R O U G E − 1 ) + 0.3 ∗ f − s c o r e ( R O U G E − 2 ) + 0.5 ∗ f − s c o r e ( R O U G E − L ) f-score=0.2*f-score(ROUGE-1)+0.3*f-score(ROUGE-2)+0.5*f-score(ROUGE-L) fscore=0.2fscore(ROUGE1)+0.3fscore(ROUGE2)+0.5fscore(ROUGEL)
赛题难点

  • 评价指标采用jieba分词,以字为粒度的模型效果不佳。

  • 数据集和通用领域存在一定差距。

  • 存在部分对抗样本,会对模型造成一定干扰。

    对抗样本:信用逾期了,银行打电话骚扰我父母,如何处理

方案设计

模型选择

权重:T5-PEGASUS

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rhHZUHmV-1679832129072)(F:\weixin\imgs\image-20230325102206382.png)]

优势

  1. 词典增加结巴分词,更贴合本次比赛任务;
  2. mt5基础上预训练,在中文生成任务上性能更佳。

领域预训练

数据来源:罪名法务智能项目及和鲸社区法律问答数据集.

数据样例:

问题没有签订合同,没买保险,是在工地受伤的, 别人说是他违规操作这样去走司法程序是会 理亏吗农村私人雇佣导致工伤,但是没有签订合同, 都是同村的人雇佣做工,这个可以维权吗
候选答案不理亏
您好,建议协商不成可以到法院起诉 需要把案情仔细说一遍
可以双方协商赔偿,雇佣方需要承担一定责任。
可以的,属于提供劳务者受害责任纠纷
可以要求赔偿但不是通过工伤的名义。
标准回复您好,可以维权,建议直接提起诉讼,由雇佣 方承担一定责任,但不算工伤。

训练样本构造:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Io6fg1OQ-1679832129073)(F:\weixin\imgs\image-20230325102603219.png)]

方案存在问题:

  1. 赛题训练集中标准答案部分字符来自于候选答案,构造的数 据中会存在标准答案和候选答案无公共序列问题;
  2. 构造的数据会出现无候选答案情况;
  3. 给定标准答案非人工标准最佳答案,存在一定噪声

采用预训练-微调方式可以在一定程度上缓解预训练数据噪声的影响。

对抗训练

对模型的 embedding层添加扰动,让模型在增加扰动的情况继续向减小损 失的方向进行优化,可以有效地提升模型的鲁棒性和泛化能力,尤其是在 面对对抗样本的时候能够有稳定的表现。

FreeLB > FGM > PGD

结论:预训练和微调阶段都使用FreeLB效果最好

稀疏SoftMax

使用稀疏化SoftMax替换SoftMax,避免SoftMax过度学习而导致过拟合。 稀疏化即计算概率的时候,只保留前k个,后面的直接置零。

结论:仅在微调阶段使用,预训练阶段使用效果下降。

伪标签

  1. 使用模型集成后结果创建伪标签数据;
  2. 和原有训练集混合进行五折单模训练;
  3. 五折模型预测结果进行集成。

在这里插入图片描述

赛题总结

融合方式-投票

  1. 首先从多个预测答案中抽取出第一条作为预测答案,其余作为标准答案;
  2. 然后计算出预测答案和所有标准答案的分值,累加起来作为该预测答案的得分;
  3. 最后选取得分最高的作为最终答案。

这种模型融合方式适用于阅读理解、摘要等复杂任务

性能对比

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-F39ItjWK-1679832129074)(F:\weixin\imgs\image-20230325103044477.png)]

展望

  • Copy机制
  • 构造更优预训练数据
  • 搭建异构模型
  • 今年是2023年,可以使用其他新出的生成模型,例如:bart、mengzi、fengshen等生成模型进一步实验效果。

结论

最近llms大火,本文回忆了sodic2021 亚军获奖方案,该方案采用T5的文本生成方法,取得了不错的效果,随着各种生成模型的爆发,使用其他的生成模型或许也能取得更好的效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/3509.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python 练习 六

1、(最大数的出现)编写程序读取整数,找出它们中的最大值,然后计算它的出现次数。假设输入以数字0结束。假设你输入的是“352555 0";程序找出的最大数是5,而5的出现次数是4。(提示:维护两个变量max和 count。变量max存储的是当前最大数,而…

CentOS 7安装redis6.2.6(包括服务开机自启和开放端口)

CentOS 7安装redis6.2.61. 官网下载redis文件2. 校验安装依赖2.1 安装系统默认版本gcc2.2 升级gcc版本3. 解压编译安装4. 修改配置redis.conf4.2 设置密码4.3 绑定ip(可选)5. 启动redis服务并测试5.2 测试安装是否成功5.3 redis开机自启配置6.开放防火墙…

QT表格控件实例(Table Widget 、Table View)

欢迎小伙伴的点评✨✨,相互学习🚀🚀🚀 博主🧑🧑 本着开源的精神交流Qt开发的经验、将持续更新续章,为社区贡献博主自身的开源精神👩‍🚀 文章目录前言一、图示实例二、列…

art 虚拟机相关

​​​​​​​虚拟机中对象锁实现分析 Android 库加载命名空间 https://source.android.google.cn/docs/core/architecture/vndk/linker-namespace Android共享库命名空间-CSDN博客 编译 prebuilts/clang/host/linux-x86/clang-r450784d/bin/llvm-addr2line -f -C -e…

项目文章 | 缓解高胆固醇血症 ,浒苔多糖如何相助?

文章标题:Polysaccharides from Enteromorpha prolifera alleviate hypercholesterolemia via modulating the gut microbiota and bile acid metabolism 发表期刊:Food & Function 影响因子:6.317 作者单位:福建医科大…

关于Docker逃逸

关于Docker逃逸 文章目录关于Docker逃逸前言一、判断是否为docker容器?二、privileged特权模式启动容器逃逸三、 Docker Remote API未授权访问逃逸四、危险挂载导致Docker逃逸五、危险挂载Docker Socket逃逸六、 挂载宿主机procfs逃逸七、脏牛漏洞来进行docker逃逸八…

蓝桥杯C/C++VIP试题每日一练之矩形面积交

💛作者主页:静Yu 🧡简介:CSDN全栈优质创作者、华为云享专家、阿里云社区博客专家,前端知识交流社区创建者 💛社区地址:前端知识交流社区 🧡博主的个人博客:静Yu的个人博客 🧡博主的个人笔记本:前端面试题 个人笔记本只记录前端领域的面试题目,项目总结,面试技…

Qt容器学习

Qt容器Qt容器主要优点就是在所有的平台上的运行都表现的一致,并且它们都是隐含共享的.Qt容器的另外一个主要特征就是易于使用的迭代器类,它们可以利用QDataStream变成数据流,而且他们通常可以使用执行文件中的代码量比相应的STL类中的要少.最后Qt/Embedd…

动态规划---线性dp和区间dp

动态规划(三) 目录动态规划(三)一:线性DP1.数字三角形1.1数字三角形题目1.2代码思路1.3代码实现(正序and倒序)2.最长上升子序列2.1最长上升子序列题目2.2代码思路2.3代码实现3.最长公共子序列3.1最长公共子序列题目3.2代码思路3.3代码实现4.石子合并4.1题目如下4.2代…

论文解读:Less is More: Learning Highlight Detection from Video Duration

引言 高亮检测有可能极大地简化视频浏览,但现有的方法往往受到昂贵的监督要求的影响,人类观众必须手动识别训练视频中的高亮部分。我们提出了一种可扩展的无监督解决方案,利用视频时长作为隐式监督信号。我们的关键见解是,来自较…

【lwIP(第三章)】内存管理

目录一、内存管理简介二、lwIP内存堆和内存池应用三、lwIP内存堆简介1. First Fit算法2. lwIP内存堆原理解析2.1 mem_init程序解析2.2 mem_malloc程序解析2.3 mem_free程序解析四、lwIP内存池简介1. 实现lwIP内存池的文件2. lwIP内存池函数2.1 memp_init()2.2 memp_malloc()2.3…

数据迁移工具

1.Kettle Kettle是一款国外开源的ETL工具,纯Java编写,绿色无需安装,数据抽取高效稳定 (数据迁移工具)。 Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制。 Kettle 中文名称叫水壶,该项目的主程序…

SpringBoot整合Redis、以及缓存穿透、缓存雪崩、缓存击穿的理解分布式情况下如何添加分布式锁 【续篇】

文章目录前言1、分布式情况下如何加锁2、具体实现过程3、测试3.1 一个服务按照多个端口同时启动3.2 使用jmeter进行压测前言 上一篇实现了单体应用下如何上锁,这一篇主要说明如何在分布式场景下上锁 上一篇地址:加锁 1、分布式情况下如何加锁 需要注意的点是: 在上锁和释放…

Android开发-Android UI与布局

01 Android UI 1.1 UI 用户界面(User Interface,简称 UI,亦称使用者界面)是系统和用户之间进行交互和信息交换的媒介,它实现信息的内部形式与人类可以接受形式之间的转换。软件设计可分为两个部分:编码设计与UI设计。 1.2 Andr…

【数据结构与算法】堆与堆排序

目录一.堆的实现1.堆的概念2.堆的代码实现二.堆排序的讲解一.堆的实现 1.堆的概念 堆是一种数据结构,首先它总是一颗完全二叉树(因为堆适合表示完全二叉树),在逻辑上堆是一颗完全二叉树,真正实现上是使用数组来实现的。根据不同的规则(任意…

OpenMV快速上手 | OpenMV硬件版本概述及HelloWorld

文章目录一、OpenMV1. 什么是OpenMV2. OpenMV版本2.1. OpenMV1(M4 V1)2.2. OpemMV2(M4 V2)2.3. OpenMV3(M7)2.4. OpenMV4(H7)二、OpenMV开发环境搭建三、hello world1. 连接OpenMV2.…

AtCoder Beginner Contest 295——A-D讲解

蒟蒻来讲题,还望大家喜。若哪有问题,大家尽可提! Hello, 大家好哇!本初中生蒟蒻讲解一下AtCoder Beginner Contest 295这场比赛的A-D题! A - Probably English Problem Statement You are given NNN strings W1,W2,…

开关电源Y电容放置的位置

Y电容,是我们工程师做开关电源设计时都要接触到的一个非常关键的元器件,它对EMI的贡献是相当的大的,但是它是一个较难把控的元器件,原理上并没有那么直观易懂,在EMI传播路径中需要联系到很多的寄生参数才能够去分析。 …

Python和Excel的完美结合:常用操作汇总(案例详析)

在以前,商业分析对应的英文单词是Business Analysis,大家用的分析工具是Excel,后来数据量大了,Excel应付不过来了(Excel最大支持行数为1048576行),人们开始转向python和R这样的分析工具了&#…

JNI原理及常用方法概述

1.1 JNI(Java Native Interface) 提供一种Java字节码调用C/C的解决方案,JNI描述的是一种技术。 1.2 NDK(Native Development Kit) Android NDK 是一组允许您将 C 或 C(“原生代码”)嵌入到 Android 应用中的工具,NDK描述的是工具集…
最新文章