科研成果 | 数说故事联合中大HCP实验室共创「大模型」领域论文,获国际AI学术顶会AAAI收录

日前,中国计算机学会(CCF)推荐的A类国际学术会议AAAI人工智能大会 2024论文接收结果公布。中山大学HCP实验室和数说故事研究员合著的论文《Adaptive Prompt Routing for Arbitrary Text Style Transfer with Pre-trained Language Models》成功被「人工智能领域」国际顶级会议AAAI录用。这是继上半年与IDEA联合共创学术论文获NLP国际顶会 ACL 2023收录后的又一重大突破,不仅展示了论文研究学者们在人工智能领域的卓越研究能力和创新思维,更是双方在人工智能领域不断突破能力边界,实现AI技术的商业化应用的有力证明。

◎更多阅读:权威硬核认证|数说故事携手IDEA共创学术论文获NLP国际顶会 ACL 2023收录

图片

图片

AAAI 2024共收到12,000余份论文投稿,最终录用2,342篇论文,录用率仅为23.75%。AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最权威的学术组织之一,由计算机科学和人工智能领域奠基人Allen Newell、Marvin Minsky、John McCarthy等学者于1979年共同创立,旨在推动智能思维与行为机制的科学理解及机器实现,并促进人工智能的科学研究和规范应用。AAAI是国际顶级学术会议——AAAI人工智能大会(AAAI Conference on Artificial Intelligence)的组织者。

此篇论文是数说故事专注于Social领域的商业大模型——SocialGPT的一次核心探索,基于数说故事海量的社媒数据,利用人工智能、大数据挖掘分析、算法等技术,以及SocialGPT独有的垂直聚焦商业问题、实时更新迭代、更懂消费者的三大应用特征,为研究提供了坚实的基础。通过该研究提出的方法,社交媒体平台和内容创作者可以更灵活、更高效地进行文本风格转换,满足用户的个性化需求并提升内容的吸引力。这对于推动社交媒体内容创作和传播,提高用户体验以及提升品牌形象都具有重要的影响。

DataStory

自适应提示引擎:

打开智能文本“变身”新思路

自ChatGPT横空出世以来,大语言模型(LLM)的相关研究一直是学术界的热点。众所周知,在实际应用中,大模型的输出效果受prompt的质量影响很大,而对于一个复杂的场景,往往需要多个prompt的紧密配合,prompt的设计和选择成为了一个关键问题,甚至催生了一个新兴的工作内容——提示工程(Prompt Engineering)。但目前,在大多数场景中,prompt的设计和选择还是以个人经验为主,缺乏稳定的范式和框架。

本次论文中,双方合力聚焦于常见的自然语言处理任务——文本风格迁移(Text Style Transfer,TST),提出了自适应提示路由(Adaptive Prompt Routing ,APR)框架,用于自适应地根据输入文本和任务,从候选集合中选择合适的prompt。具体来说,我们首先为目标任务构造一个候选prompt集,其中包含多种人类可读的prompt。随后,我们训练了一个prompt路由模型,根据输入文本选择最优prompt。最后,以最优的prompt联合输入文本输入到LLM中,得到文本风格迁移的结果。经测试,在3个普遍使用的LLM上,4个TST基准测试均通过APR框架实现了最优的风格迁移效果。

文本风格迁移/

Text Style Transfer,TST

文本风格迁移是自然语言处理领域一个经典任务,属于可控文本生成范畴,目标是调整输入文本的风格或样式,同时保留与风格或样式无关的内容并保持文本的流畅性,从而在营销文案生成、内容合规、自动化报告等多种实际场景下展现出强大的适应性,例子如下:

安利风格→务实推荐风格

安利风格

从今年被我室友种草了一个赫莲拉的美白面膜,就一直用,用到现在看起来白净透亮的多!听室友说这个有美白特证, 我感觉它的性价比还挺高的,一百多两瓶 对于生活费并不高的我来说用起来也没有压力!🙈 用完之后第二天脸上依旧清清爽爽的!对油皮来讲真的会成为心头好!!一直坚持再用,用完两瓶之后,肤色匀净透亮很多,而且白白嫩嫩的。我还刻意停用了一段时间,没反黑也没长毛!💓 除了用护肤品,平常我还注意做好防晒,平常多喝温开水、多吃水果!--- 重要还是得坚持,是一定会收获惊喜的!💓 #美白面膜 #便宜好用的美白面膜 #黄黑皮 #去黄提亮 #学生党好物

务实推荐风格

最近,我的室友向我推荐了赫莲拉的一款美白面膜。使用三个月后,就个人感受来说,我肤色变得更加白皙和明亮。这款面膜拥有美白特证,价格在一百多人民币两瓶范围,性价比比较高。使用后的第二天,我的脸仍然感觉清新,很适合油性肌肤。连续用完两瓶后,我的肤色变得更加均匀,皮肤也显得白净嫩滑。在刻意停用了一段时间后,皮肤也没有变黑和长毛。除了使用这款护肤面膜,平时我也会注意做好防晒工作,多喝开水,多吃水果来促进肌肤健康。我认为坚持使用美白产品是关键,只要坚持不懈,就会有惊喜的发现。

采用自适应提示路由框架可以显著提升文本风格迁移任务的“变身”性能。此次的研究有别于传统的人工选择prompt,APR能够根据输入文本的特征和目标任务的需求,自动选择最合适的prompt,大大减少人工干预的成本和工作量,同时也提高prompt的设计和选择的稳定性和可靠性。

此篇论文中的文本风格迁移任务,在数说故事的多个场景中有落地应用:

分析师助手 

01

商业分析师在撰写报告的时候,可通过该项技术实现快速的风格/格式转换,以适应不同报告受众的需求。

分析报告有几种常见的格式:简短明快、适合汇报的版本,深度详细、适合细究的版本等等。通过文本风格迁移技术,分析师助手可为同一内容同时构建不同的格式,快速构建不同场合使用的版本,只需后续少量人工校正即可使用。

另外一个场景是对UGC评论进行分析,可通过文本风格迁移技术,将带有情感极性的表述转化为中性的表述,方便进一步归因洞察,同时便于生成客观中性的总结。

人机对话

02

通过风格转换技术,可快速实现机器人设的切换,效果更加稳定。

通过定制不同风格人设的机器人来表现出不同的语言风格,从而提供更加生动有趣的对话体验。假设有一个智能聊天机器人,它可以被定义为活泼型、幽默型、正式型等不同的人设。当用户与该机器人进行对话时,机器人可以根据用户的喜好和需求,以相应的语言风格进行回复。比如,如果用户喜欢幽默风格,那么机器人可以使用幽默的措辞和表达方式进行回复;如果用户需要正式的信息或者商务交流,机器人则可以使用正式的语言风格进行回复。

营销内容生成

03

协助营销物料进行稳定、无损的风格裂变,达到最优的生成效果。

通过文本风格迁移技术,企业可以根据不同的营销平台和目标受众,生成适合该平台和目标受众的文案风格。假设我是户外运动鞋品牌的内容营销经理,可以把官方的文案直接转换成俏皮且轻松的种草安利风格的描述。这样的转变可以帮助企业更好地与目标客户进行沟通,并提高品牌形象和市场竞争力。

经典方法中,模型的效果受制于平行语料的短缺,自从LLM爆火之后,研究者发现LLM对于文本风格迁移有较好的结果,此类方案包括:

a. 对LLM进行指令微调

b. 设计优良的prompt

c. 针对任务搜索出固定的prompt

此类方案依然存一些问题:

01

 prompt的选择对于输入数据是敏感的(如图1),以上方案并未考虑输入数据的影响。

图片

02

设计或搜索出来的最优prompt,往往对于人类是不可读的

针对此问题,我们引入了ARP框架,它可以自动从一组人类可读的prompt集合中,为输入文本选择合适的prompt。图2为ARP框架的执行流程。APR依赖于两个关键组件:

1)一组多样化的、人类可读的prompt集合

为了让不同的输入文本都找到合适的prompt,我们构建了一个多样化的、人类可读的prompt集合。构建过程包括两个步骤。首先,我们手动设计一些TST的种子prompt。然后,使用GPT-3.5生成更大、更多样化的prompt集合。prompt集合具有相似的含义,但表达式和格式不同。

2)一个提示路由模型,从prompt集合中为每个输入文本选择合适的prompt

随机挑选输入文本和prompt集合中的prompt,组合成完整的输入,并输入到LLM中,得到LLM的输出。对LLM的输出进行标注,人工挑选出效果优异和效果较差的输出,得到一个二分类的训练集。用BERT编码器加一层全连接层和Sigmoid函数组成的模型进行训练,即可得到提示路由模型。实际使用中,将输入文本和prompt组合输入到模型中,模型可预测出prompt对输入文本的匹配程度。

图片

文本风格迁移技术在商业应用中具有广泛的应用前景。通过适当地转换文本的风格,企业可以更好地与目标受众进行沟通,并提升用户体验、品牌形象和市场竞争力。未来,我们将进一步提升框架的“变身”性能,并应用于数说故事SocialGPT的落地点中。通过自适应提示路由框架的引入,我们将进一步为大模型的应用提供更加稳定和可靠的方案,从而推动自然语言处理技术的进一步发展。

关于中山大学HCP实验室

中山大学人机物智能融合实验室围绕“人工智能前沿技术与产业化”布局研究方向与课题,并深入应用场景打造产品原型,输出大量原创技术及孵化创业团队。在多模态认知计算、机器人与嵌入式系统、元宇宙与数字人、可控内容生成等领域开展体系化研究,以“攀学术高峰、踏应用实地”为工作理念。

实验室由林倞教授创办于2010年,目前由包含3名国家级人才的教授团队领衔,其中林倞教授入选IEEE Fellow、IAPR Fellow、IET Fellow。实验室承担或者已完成各级科研项目60余项,包括国家2030重大项目、国家重点研发计划项目、国家自然科学基金委-广东大数据科学中心项目、国家自然基金委重点项目等,共获得科研经费超过5千万元。科研团队在顶级国际学术期刊与会议上发表论文400余篇,包括在IEEE/ACM Trans汇刊发表论文100余篇,在顶级会议发表论文150余篇,获得一系列国际会议和期刊的最佳论文奖。实验室同样注重成果转换,与知名IT及人工智能企业,例如中兴通讯、华为昇腾计算事业部、华为诺亚方舟实验室、广州视源科技等,开展广泛合作,完成企业委托研发项目。2022年实验室孵化创新企业拓元智慧,打造通用多模态认知AI技术平台,深度赋能元宇宙及内容创造各主要应用场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/256446.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

解决虚拟机报错:当前硬件版本不支持设备“nvme”。

报错内容如下图所示: 当前硬件版本不支持设备“nvme”。 未能启动虚拟机。 我们首先在帮助里面查看VMware的版本 我这里是16 打开报错的虚拟机文件夹,找到镜像文件(.vmx文件) 使用记事本(文本编辑器)打开…

metabase filter

What’s this for? Variables in native queries let you dynamically replace values in your queries using filter widgets or through the URL. 本机查询中的变量允许您使用过滤器小部件或通过 URL 动态替换查询中的值。 Variables {{variable_name}} creates a variable…

详细教程 - 进阶版 鸿蒙harmonyOS应用 第十一节——鸿蒙操作系统中的音频播放封装

简介 音频播放是开发鸿蒙应用时的一个重要功能。在这篇文章中,我们将详细探讨如何在鸿蒙系统中实现音频播放的封装,并提供一些代码示例。 一、JAVA版音频播放的实现 在鸿蒙操作系统中,我们可以使用ohos.media.player.Player类来实现音频播放…

linux:掌握systemctl命令控制软件的启动和关闭、掌握使用ln命令创建软连接

掌握使用systemctl命令控制软件的启动和关闭 一:systemctl命令: Linux系统很多软件(内置或第三方)均支持使用systemctl命令控制:启动停止、开机自启 能够被systemctl管理的软件一般也称之为:服务 语法: systemctl | start | stop | status | enable …

【Spring教程31】SSM框架整合实战:从零开始学习SSM整合配置,如何编写Mybatis SpringMVC JDBC Spring配置类

目录 1 流程分析2 整合配置2.1 步骤1:创建Maven的web项目2.2 步骤2:添加依赖2.3 步骤3:创建项目包结构2.4 步骤4:创建SpringConfig配置类2.5 步骤5:创建JdbcConfig配置类2.6 步骤6:创建MybatisConfig配置类2.7 步骤7:创建jdbc.properties2.8 步骤8:创建SpringMVC配置…

漏电保护芯片是什么?具有什么作用?

漏电保护芯片是一种用于监测电气设备是否存在漏电并提供保护的微型芯片。漏电是电气设备中普遍存在的一种安全隐患,当设备发生漏电时,电流会流回地线,并可能导致电击、火灾等严重后果。因此,漏电保护芯片的使用对于保障人身财产安全具有非常重要的意义。下面就是我们几款漏电保…

Python操作Word

Python操作Word 一、Word简介二、向Word写入内容2.1 导入模块2.2 创建doc文档对象2.3 添加段落2.4 添加列表2.5 添加图片2.6 保存文件 三、读取Word内容四、批量生成Word文件 一、Word简介 ​ 在日常工作中,有很多简单重复的劳动其实完全可以交给Python程序&#x…

基于javaweb实现的家教系统

一、系统架构 前端:jsp | js | css | jquery 后端:spring | springmvc | spring-orm 环境:jdk1.7 | mysql 二、代码及数据库 三、功能介绍 01. 管理后台-首页 02. 管理后台-用户信息管理 03. 管理后台-订单信息管理 04. 管理后台-辅…

在Java中高效使用Lambda表达式和流(Streams)的技巧

Java中如何高效使用Lambda表达式和流(Streams)的技巧 1. 简介 在Java中,Lambda表达式和流(Streams)是Java 8引入的两个强大的特性。Lambda表达式为Java添加了一种简洁的方式来实现函数式编程,而流提供了一…

强大的剪切板管理 Paste中文 for Mac

Paste是一款剪切板管理工具,它可用于Mac和iOS设备。Paste的主要功能是帮助用户管理剪切板中的复制和剪切的内容,使其更方便地访问、组织和重用。 以下是Paste剪切板管理工具的主要特点和功能: 剪切板历史记录:Paste会自动记录您复…

从头开始实现LoRA以及一些实用技巧

LoRA是Low-Rank Adaptation或Low-Rank Adaptors的缩写,它提供了一种用于对预先存在的语言模型进行微调的高效且轻量级的方法。 LoRA的主要优点之一是它的效率。通过使用更少的参数,lora显著降低了计算复杂度和内存使用。这使我们能够在消费级gpu上训练大…

uniapp H5项目使用ucharts的Echart组件方式创建圆环

问题:没有报错但是图表不出来 【 调试了半天圆环图表没有不出来。是因为没有明示设置宽度与高度】 /* 请根据实际需求修改父元素尺寸,组件自动识别宽高 */ .charts-box { width: 100%; height: 300px; } 最终效果 先导入ucharts到项目 uniapp的项目…

大模型(LLM)+词槽(slot)构建动态场景多轮对话系统

构建动态场景多轮对话系统 引言 在人工智能和自然语言处理领域,聊天机器人的开发一直是一个热点话题。近年来,随着大型语言模型(LLM)的进步,构建能够理解和响应各种用户需求的聊天机器人变得更加可行和强大。本文将介…

机器学习---决策树

介绍 决策树和随机森林都是非线性有监督的分类模型。 决策树是一种树形结构,树内部每个节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶子节点代表一个分类类别。通过训练数据构建决策树,可以对未知数据进行分类, 随机森林是由多个决策树组成,随机森林中每…

很抱歉,Midjourney,但Leonardo AI的图像指导暂时还无人能及…至少目前是这样

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

使用Python Scrapy设置代理IP的详细教程

目录 前言 一、代理IP的作用和原理 二、Scrapy框架中设置代理IP的方法 步骤1:安装依赖库 步骤2:配置代理IP池 步骤3:创建代理IP中间件 步骤4:激活代理IP中间件 步骤5:运行爬虫程序 三、代码示例 四、常见问题…

Redis7--基础篇9(SpringBoot集成Redis)

1. jedis、lettuce、Redistemplate的关系 第一代为jedis,之后推出了lettuce,然后springboot继承了Redistemplate,现推荐使用Redistemplate。 总的来说,jedis、lettuce、Redistemplate都是java操作Redis数据库的驱动。 2. 本地Ja…

一文快速了解oCPX

01 什么是oCPX o是Optimized,优化一词的首字母。 CPX即Cost Per X,“X”即泛指传统的那些按不同方式进行结算的模式,如:CPC(Cost Per Click,按点击付费)、CPM(Cost Per Mille&…

我从阿里云学到的返回值处理技巧

作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO 联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬 阿里云CosmoController…

为什么多片DDR菊花链拓扑连接时末端需要接很多的电阻

大家如果做过DDR的设计可能会发现在进行多片DDR连线时,通常在信号的末端会放置很多的电阻(如下图所示),那么这些电阻都是起什么作用的呢? 通常在DDR末端的电阻是为了防止信号反射的,起阻抗匹配的作用,之前我们介绍过另…
最新文章