基于GPTs个性化定制SCI论文专业翻译器

1. 什么是GPTs

GPTs是OpenAI在2023年11月6日开发者大会上发布的重要功能更新,允许用户根据特定需求定制自己的ChatGPT模型。

Introducing GPTs 官方介绍页面icon-default.png?t=N7T8https://openai.com/blog/introducing-gpts

在原有自定义ChatGPT的流程中,首先需要自己编制prompts和各种指令,每次新对话都需要重新复制粘贴到ChatGPT对话中,用户操作繁复。OpenAi为了应对不断增长的定制化功能的需求,终于推出了GPTs,以允许用户创建特定用途定制ChatGPT版本

目前,ChatGPT Plus用户已经可以使用GPTs创建并分享个性化的My GPTs模型。自定义的GPTs模型有两种配置方式,包括:

(1)通过自然语言与GPT Builder交流:GPT Builder会对于自定义GPT的名字、头像(可以由DALL·E生成)、希望实现的功能等进行提问,根据用户回答在GPT Configure中生成对应的NameDescriptionInstructionsConversation starters

(2)直接自定义Configure:包括GPT名称(Name)功能描述(Description)预定义指令(Instructions)用户首次使用可以参考的提示语(Conversation starters)知识库(Knowledge, 用户自主上传文档)增强功能(网页搜索、AI 绘画DALL·E、代码分析器)、其他拓展(Action: GPT retrieve information or take actions outside of ChatGPT)、隐私设置等。


    

图为自然语言(左)直接定义(右)两种方式自定义GPTs。

2. 实际应用:创建一个基于GPTs开发专业的中英文翻译器

下面将根据本人的实际需求出发,创建一个基于GPTs的适用于自己所在专业的中英文翻译器,翻译器中集成了中英互译对照表,并具有一定的专业理论与专业知识。最终效果如下图所示。

2.1 专业中英文翻译的需求

目前市面上场景的机器翻译产品均不能很好满足需求。通用翻译器,例如百度翻译与谷歌翻译,其对于专业词汇翻译不准确;DeepL翻译器的术语表需要高级付费订阅,并且在今年才新加入中英术语对照功能;SDL Trados面向专业译者,定义术语表等功能使用复杂;原有chatGPT产品,每个新对话均需要将术语表和指令重新键入一次,重复性操作多,非常繁琐。因此,使用新发布的用户自定义GPTs模型,将专业术语和专业知识整合,并可以检索专业理论和语料库,能够充分满足需求。

笔者是轨道交通专业,希望创建一个基于GPT的英文学术论文翻译器,便于将中文手稿转换至专业的英文论文形式。在中英转换过程中,需要保证术语翻译的准确性。此外,自定义的GPT模型还应具有英文论文翻译至中文的能力,便于我阅读英文文献。

打开chatGPT用户界面,在左上角Explore中具有Create a GPT的菜单。

点击后可以选择是基于自然语言创建的Create模式,或者直接定义好prompts的Configure模式两者之间可以随时切换使用。

在Create模式中,通过与GPT Builder对话交流所定义的GPT,可以自动填充至对应的Configure内容

因此,可以先使用Create模式创建大体框架,再检查Configure模式修缮定义细节。

2.2 定义GPT模型

以下InstructionsPrompts均是使用英文进行的定义,会给出对应的中文翻译和如此定义的原因。

1) Name(GPT模型名称)

Railway academic translator 

参考翻译:铁路学术翻译器

2)Description(出现在名称下面的功能描述)

Translates papers, prioritizing academic writing standards.

参考翻译:翻译论文,优先考虑学术写作标准。

3)Instructions(GPTs指令)

The Railway academic translator is designed to translate railway transportation academic papers between Chinese and English, prioritizing academic writing standards and terminology accuracy for SCI journals. It retains original Chinese or English names for personal names. In cases of ambiguous or unclear text, it seeks further information from the user or offers multiple translation interpretations. It utilizes a detailed Chinese-English terminology glossary for precise and reliable translations in this field. An important update is to preserve original citations, such as [1], in the translated content, ensuring they are not altered or formatted incorrectly. This allows for easy reference and comparison with the original document.


参考翻译:Railway academic translator旨在将铁路运输领域的学术论文在中文和英文之间进行翻译,优先考虑符合SCI期刊的学术写作标准和术语准确性。它保留原文中的中文或英文个人名字。在文本含糊不清或不明确的情况下,它会向用户寻求更多信息或提供多种翻译解释。这款翻译器使用详细的中英术语对照表,以确保在此领域内进行精确可靠的翻译。一个重要的更新是保留原始文献中的引用,如[1],以确保它们在翻译内容中不被更改或格式化错误。这样可以方便地与原始文档进行参照和比较。

注意:

a) 保留原文中的中文或英文个人名字 

为了便于根据原名进行论文检索,这要求在汉译英之前的中文稿件中也同时保持英文名称书写

b) 在文本含糊不清或不明确的情况下会向用户寻求更多信息 

由于术语表可能不够完整,因此当出现让chatGPT对于术语翻译出现困惑时,能够询问用户请求给予更详细的解释

c) 保留原始文献中的引用,如[1]

GPTs目前具有网页搜索功能,会返回带有引用符号的文本链接,这可能与英文论文写作中的引用发生富文本形式类型上的冲突,而将原文的引用删除。需要通过此Prompts保留原论文中的引用。

4)Conversation starters(用于提示用户,一键提问)

笔者撰写了四条:

  • Please enter the paragraph you want to translate.
  • 请键入希望翻译至英文的中文论文段落
  • Do you need a translation for academic terms?
  • 需要在非母语英文学术写作中获得帮助吗?

5) Knowledge(知识库,用于GPTs在回答问题前的检索)

Conversations with your GPT may include file contents. Files can be downloaded when code interpeter is enabled. 与GPT的对话可以包括文件内容。当启用code interpeter程序时,可以下载文件。

用户自定义的文档,支持各种常见的文本文档、电子表格、演示文档等格式,每个用户单文件上限500MB,一次最多上传10个文件,每个用户总文件上限为10GB。

具体规定请参考:
ChatGPT上传文件相关问题 | OpenAI Help Centericon-default.png?t=N7T8https://help.openai.com/en/articles/8555545-uploading-files-with-advanced-data-analysis-in-chatgpt实际使用过程中,Word、PDF、CSV等均可以识别使用。但是,当文档内容超过数十MB时,检索速度就会比较长(可能持续数十秒)。因此,在使用时注意知识库的精简和重点突出

笔者上传了两份文件,分别是我自己整理的中英文对照表word文档,和一份本专业领域的文献综述。我上传的专业名词术语库是使用自然语言定义的。

 

如上图所示,自定了专业术语表(左),也上传了专业相关的文献综述文档(右)。

6) Capabilities

根据需要选择是否需要网页检索与图片生成功能。

  • Web Browsing
  • DALL·E Image Generation

在完成上述定义后,右上角可以选择是否公开此GPT(Public)。

每次修改Configure之后,会提示需要Update模型

3. 使用测试

返回chatGPT初始界面,选择Explode,进入自定义的My GPTs陈列区。

单击对应的模型即可使用。

3.1 中文论文翻译至英文

找了一篇很久之前下载的论文摘要部分,复制段落给My GPTs,并将其翻译为英文。

翻译准确,术语使用规范。中英文对应较好。由于语言润色暂时不在此GPTs考虑范畴内,因此可以判断此GPTs已经优秀的完成了任务。

作为对比,给出某度翻译的结果,不准确或者错误的翻译使用下划线表示。并且,通读下来译文的质量对比也是一目了然。

Independent rotating wheel is the key technology to realize 100% low floor truck. Unlike rigid wheelsets, after the left and right wheels are decoupled, the independently rotating wheels no longer have the ability of linear alignment and curve guidance, which hinders the application of independently rotating wheels. ... Taking the actual research object as an example, this paper constructs the SIMPACK dynamic model of the independent rotating wheel, and simulates the straight line neutral energy and curve guidance performance of the independent rotating wheel in SIMPACK. The simulation results show that the bogie with independent rotating wheels does not have the ability of linear alignment and curve guidance. PI control, LQG control and μ Based on three control strategies, the SIMPACK dynamic model of the vehicle with independent rotating wheels is established. Then a co simulation model is established. The simulation results show that the three control strategies can significantly improve the straight alignment and curve guidance performance of the independently rotating wheel. From the perspective of control effect, the control effect of PI controller and LQG controller is equivalent. The difference is that the control process of PI controller is smoother and the lateral displacement curve is smoother. Under the action of LQG controller, the independently rotating wheels can quickly return to the track center after leaving the track curve. μ The integrated controller can make the independently rotating wheels return to the center of the track, but it takes a long time.

3.2 英文SCI论文翻译至中文

从笔者研究领域的一篇SCI论文PDF文档之中复制一段,让其翻译为中文。

中文翻译结果如下图所示。总体翻译准确,易于理解,并很好保留了论文的原意。其中,“重新附着控制”对应的re-adhesion control没有出现在术语表之中,因此翻译不准确,可以通过术语表的修订解决此问题。

作为对比,某度翻译无法实现自动去除PDF复制出来的分行(当然可以使用知云翻译器等方式自动整理段落)。整理段落后,虽然整体上能够传递给读者大致的内容信息,但是诸多术语依然翻译的不准确。当然,百度推出的AI大模型翻译可能相比于传统机器翻译有所改善,这需要更多的测试,不做展开。

3.3 专业问题询问

询问专业问题,默认调用了Bing搜索,文章来源主要是ScienceDirect、SPRINGER LINK等数据库。

可以通过对话指定GPTs从知识库中搜索问题答案。当然,由于术语表定义还不够完善,以下出现了部分翻译的纰漏。但是主要回答是比较全面的,可以充当一个简便的学术论文总结工具

 

4. 结语(由chatGPT总结和撰写)

GPTs的推出预示着定制化智能服务的无限可能。通过本文的介绍和实践案例,我们已经看到了基于GPTs的个性化定制专业翻译器提高翻译效率精确度便捷性方面的显著优势。定制化的ChatGPT模型使得专业翻译不再受限于通用翻译工具的局限性,能够更精准地处理专业术语和复杂语境。通过集成了先进的网页搜索和AI绘图功能,使得翻译过程更为全面和生动。更重要的是,用户可以根据自己的专业需求和喜好,定制独一无二的GPT模型,这不仅提高了工作效率,也增加了个性化体验。当然,我们也应意识到,这项技术仍处于发展阶段,在处理极其复杂的语境或特定的专业知识时,可能还需人工干预以确保翻译的准确性。

展望未来,随着技术的不断完善和用户体验的进一步优化,基于GPTs的个性化定制专业翻译器将在更多领域发挥巨大作用,不仅限于学术翻译,还可能延伸至商务、法律等多个专业领域。这将极大地推动人工智能在语言处理领域的应用,开启全新的翻译时代。在这个充满挑战与机遇的新时代,我们期待GPTs个性化定制专业翻译器为我们带来更多的惊喜和便利,共同探索人工智能与语言艺术的无限可能。

#SCI论文 #chatGPT #人工智能 #GPT-4 #机器翻译 #AI #英汉互译 #语料库 #轨道交通

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/134549.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux学习教程(第二章 Linux系统安装)1

第二章 Linux系统安装 学习 Linux,首先要学会搭建 Linux 系统环境,也就是学会在你的电脑上安装 Linux 系统。 很多初学者对 Linux 望而生畏,多数是因为对 Linux 系统安装的恐惧,害怕破坏电脑本身的系统,害怕硬盘数据…

计算机网络——物理层-传输方式(串行传输、并行传输,同步传输、异步传输,单工、半双工和全双工通信)

目录 串行传输和并行传输 同步传输和异步传输 单工、半双工和全双工通信 串行传输和并行传输 串行传输是指数据是一个比特一个比特依次发送的。因此在发送端和接收端之间,只需要一条数据传输线路即可。 并行传输是指一次发送n个比特,而不是一个比特&…

C/C++(a/b)*c的值 2021年6月电子学会青少年软件编程(C/C++)等级考试一级真题答案解析

目录 C/C(a/b)*c的值 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 C/C(a/b)*c的值 2021年6月 C/C编程等级考试一级编程题 一、题目要求 1、编程实现 给定整数a、b、c,计算(a / b)*c的值&…

C#,数值计算——函数计算,Eulsum的计算方法与源程序

1 文本格式 using System; namespace Legalsoft.Truffer { public class Eulsum { private double[] wksp { get; set; } private int n { get; set; } private int ncv { get; set; } public bool cnvgd { get; set; } pri…

2023数据安全战场回顾:迅软科技助您稳固阵线

随着各行业的数字化转型不断深入,数据安全逐步进入法制化的强监管时代。然而,由于人为攻击、技术漏洞和监管缺位等原因,各种数据泄露事件频繁发生,企业数据安全威胁日益严峻。 以下是我对2023年第三季度安全事件的总结&#xff0c…

Maven Profile组设置

application.properties中xxxx

JS实现数据结构与算法

队列 1、普通队列 利用数组push和shif 就可以简单实现 2、利用链表的方式实现队列 class MyQueue {constructor(){this.head nullthis.tail nullthis.length 0}add(value){let node {value}if(this.length 0){this.head nodethis.tail node}else{this.tail.next no…

强化学习中蒙特卡罗方法

一、蒙特卡洛方法 这里将介绍一个学习方法和发现最优策略的方法,用于估计价值函数。与前文不同,这里我们不假设完全了解环境。蒙特卡罗方法只需要经验——来自实际或模拟与环境的交互的样本序列的状态、动作和奖励。从实际经验中学习是引人注目的&#x…

第二十五节——Vuex--历史遗留

文档地址 Vuex 是什么? | Vuex version V4.x 一、概念 Vuex 是一个专为 Vue.js 应用程序开发的状态管理模式 库。它采用集中式存储管理应用的所有组件的状态,并以相应的规则保证状态以一种可预测的方式发生变化。一个状态自管理应用包含以下几个部…

HuggingFace模型头的自定义

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 在本文中我们将介绍如何使HuggingFace的模型适应你的任务,在Pytorch中建立自定义模型头并将其连接到HF模型的主体&#…

大数据Doris(二十一):数据导入演示

文章目录 数据导入演示 一、启动zookeeper集群(三台节点都启动) 二、启动hdfs集群

LLM代码生成器的挑战【GDELT早期观察】

越来越多的研究开始对LLM大模型生成的代码的质量提出质疑,尽管科技行业不断推出越来越多的旨在增强甚至取代人类编码员的工具。 随着我们(GDELT)继续探索和评估越来越多的此类工具,以下是我们的一些早期观察结果。 在线工具推荐&a…

CCF ChinaSoft 2023 论坛巡礼|机器人大模型与具身智能挑战赛

2023年CCF中国软件大会(CCF ChinaSoft 2023)由CCF主办,CCF系统软件专委会、形式化方法专委会、软件工程专委会以及复旦大学联合承办,将于2023年12月1-3日在上海国际会议中心举行。 本次大会主题是“智能化软件创新推动数字经济与社…

银行卡转账记录p图软件,建设邮政工商招商农业,易语言回执单生成开发!

花了好长时间设计出来了这么一个软件,当然各个功能我都做了防范处理界面还有生成的图片都有对应的水印提示,做不了啥坏事,这里就是分享下原理和代码还有运行逻辑,仅此而已,软件加了一个画板,画面上面的图片…

Semantic Kernel 学习笔记1

1. 挂代理跑通openai API 2. 无需魔法跑通Azure API 下载Semantic Kernel的github代码包到本地,主要用于方便学习python->notebooks文件夹中的内容。 1. Openai API:根据上述文件夹中的.env.example示例创建.env文件,需要填写下方两个内…

计网:第一章 概述

目录 1.1计算机网络在信息时代作用 1.2因特网概述 1.3三种交换方式 1.4计算机网络的定义和分类 1.5计算机网络的性能指标 1.6计算机网络的体系结构 基于湖科大教书匠b站计算机网络教学视频以及本校课程老师ppt 整合出的计算机网络学习笔记 根据文章目录,具体内…

删除成绩(数组)

任务要求 设计程序,实现从多名学生某门课程的成绩查找到第一个不及格的成绩,删除其成绩,输出删除成绩后的多名学生这一门课程的成绩。任务保证至少存在1个学生的成绩为不及格。

Vuex:模块化Module :VOA模式

由于使用单一状态树,应用的所有状态会集中到一个比较大的对象。当应用变得非常复杂时,store 对象就有可能变得相当臃肿。 这句话的意思是,如果把所有的状态都放在/src/store/index.js中,当项目变得越来越大的时候,Vue…

推荐 8 款OCR工具(二)完结篇

双十一,又要剁手了,但我还是 推荐 8 款OCR工具! 当你感到迷茫时,不妨停下来,深呼吸,重新审视自己所处的位置和你的内心。这样的简单行为可能会帮助你找到方向。 SimpleOCR 网址:https://simple…

web:[网鼎杯 2018]Fakebook

题目 点进页面,页面显示为 查看源代码 用dirsearch扫一下,看一下有什么敏感信息泄露 扫出另一个flag.php和robots.txt,访问flag.php回显内容为空 请求robots.txt 网页提示/user.php.bak,直接访问会自动下载.bak备份文件 进行代码…