ChatGPT- OpenAI 的 模型(Model) 介绍

        ChatGPT的火爆程度大家都知道了,该章节我们来了解一下 ChatGPT 一个关键概念 - 模型(Model)。主要是为大家介绍一下在 OpenAI 中,究竟有哪些模型可以使用。

在后续的章节,我们会分单独的小章节逐一的为大家介绍各个不同模型的调用以及接口参数的一些说明,该章节我们先来做一个大概得了解即可。

⭐ OpenAI 模型列表
模型    描述
GPT3    一种基于人工智能的自然语言处理模型,可以实现自然语言理解和自然语言生成等任务。
GPT-3.5    基于 GPT-3 改进的模型,更加强大和智能,可以理解并生成自然语言或代码。
GPT-4    一组在 GPT-3.5 上改进的模型,可以理解并生成自然语言或代码
DALL·E    可以将自然语言描述转换为高质量图像的图像生成模型。
Whisper    一种基于语音识别和自然语言处理技术的智能语音助手,可以实现高质量的语音识别和语音转换。
Embeddings    一种自然语言处理技术,可以将自然语言文本转换为向量表示的模型。
Codex    一种可以将自然语言描述转换为代码,从而实现快速编写和自动化编程的模型。
Moderation    一种内容审核模型,可以自动检测和过滤出不良内容,从而保护用户的权益和利益。

除此之外,OpenAI还发布了一些开源模型, Point-E、Jukebox 和 CLIP,接下来就为大家分别介绍一下这些模型的作用。

⭐ GPT 模型
ChatGPT的GPT模型是一种强大的自然语言处理模型,可以自动产生自然流畅的文本。随着模型的不断升级,GPT模型的语言生成能力和应用场景也在不断扩展,为多个领域提供更加智能、高效和便捷的解决方案。

GPT-1:是最早的GPT模型,采用了基于Transformer的模型架构。它在多个自然语言处理任务上取得了良好的表现,但是生成的文本质量相对较低。
GPT-2:是GPT模型的升级版,拥有更多的参数和更强大的语言生成能力。可以自动产生高质量、连贯、自然的文本,同时也可以应用于多个领域,如智能客服、智能问答等。
GPT-3:是目前最先进的GPT模型,拥有数十亿个参数和强大的语言生成能力。它可以自动产生高质量、连贯、自然的文本,同时还可以完成更加复杂的自然语言任务,如机器翻译、自动摘要等,比 GPT-2 更加强大。
GPT-3.5:是基于 GPT-3 改进的模型,更加强大和智能,可以理解并生成自然语言或代码。
GPT4:目前处于有限测试阶段,只有获得访问权限的人才能访问。请加入候补名单,以便在容量可用时获得访问权限。
🌟 GPT-3 模型
GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。然而,最初的 GPT-3 基础模型(davinci、curie、ada 和 babbage)是目前唯一可用于微调的模型。


最新模型    描述    最大 TOKENS    训练日期
text-curie-001    非常有能力,比 Davinci 更快,成本更低。    2,049 tokens    Up to Oct 2019
text-babbage-001    能够执行简单的任务,速度非常快,成本更低。    2,049 tokens    Up to Oct 2019
text-ada-001    能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。    2,049 tokens    Up to Oct 2019
davinci    功能最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务,而且通常质量更高。    2,049 tokens    Up to Oct 2019
curie    能力很强,但比 Davinci 更快,成本更低。    2,049 tokens    Up to Oct 2019
babbage    能够执行简单的任务,速度非常快,成本更低。    2,049 tokens    Up to Oct 2019
ada    能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。    2,049 tokens    Up to Oct 2019
🌟 GPT-3.5 模型
建议在试验时使用gpt-3.5-turbo,因为它会产生最佳结果。一旦一切正常,可以尝试其他模型,看看是否能以更低的延迟或成本获得相同的结果。

GPT-3.5 模型可以理解并生成自然语言或代码。OpenAI 在 GPT-3.5 系列中功能最强大且最具成本效益的模型是 gpt-3.5-turbo,它已针对聊天进行了优化,但也适用于传统的完成任务。


最新模型    描述    最大tokens    训练日期

gpt-3.5-turbo    功能最强大的 GPT-3.5 模型并针对聊天进行了优化,
成本仅为 text-davinci-003 的 1/10,
将使用最新的模型迭代进行更新。    
4,096 tokens    
Up to Sep 2021

gpt-3.5-turbo-0301    2023 年 3 月 1 日的 gpt-3.5-turbo 快照,
与 gpt-3.5-turbo 不同,此模型不会收到更新,
并且仅在 2023 年 6 月 1 日结束的三个月内提供支持。    
4,096 tokens    
Up to Sep 2021

text-davinci-003    可以比 curie、babbage 或 ada 模型
更好的质量、更长的输出,和一致的指令
遵循来完成任何语言任务。还支持在文本中插入补全。    
4,097 tokens    
Up to Jun 2021

ext-davinci-002    与 text-davinci-003 类似的功能,
但使用supervised fine-tuning
而不是强化学习进行训练    
4,097 tokens    
Up to Jun 2021
code-davinci-002    针对代码完成任务进行了优化    8,001 tokens    Up to Jun 2021
🌟 GPT-4 模型
GPT-4 目前处于有限测试阶段,只有获得访问权限的人才能访问。请加入候补名单,以便在容量可用时获得访问权限。

GPT-4 是一个大型多模态模型(今天接受文本输入并发出文本输出,将来会出现图像输入),由于其更广泛的常识和高级推理,它可以比以前的任何模型更准确地解决难题能力。与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于传统的补全任务。

最新模型    描述    最大 TOKENS    训练日期

gpt-4    比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,

并针对聊天进行了优化。将使用最新的模型迭代进行更新。    
8,192 tokens    
Up to Sep 2021

gpt-4-0314    2023 年 3 月 14 日的 gpt-4 快照。与 gpt-4 不同,

该模型不会收到更新,并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。    
8,192 tokens    
Up to Sep 2021

gpt-4-32k    与基本 gpt-4 模式相同的功能,

但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。    
32,768 tokens    
Up to Sep 2021

gpt-4-32k-0314    2023 年 3 月 14 日的 gpt-4-32 快照。
与 gpt-4-32k 不同,此模型不会收到更新,
并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。    
32,768 tokens    
Up to Sep 2021
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比之前的任何模型都更有能力。

⭐ 特定功能的模型
虽然目前最新的 gpt-3.5-turbo 模型针对聊天对话进行了优化,但是这个模型只适合适合传统的完成任务。原始 GPT-3.5 模型针对文本补全进行了优化。

试用 gpt-3.5-turbo 是了解 API 功能的好方法。在了解要完成的任务后,我们可以继续使用 gpt-3.5-turbo 或其他模型并尝试围绕其功能进行优化。

🌟 DALL·E 模型
DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。

DALL·E模型可以生成与文本描述相符的高质量图像,包括人物、动物、物体、场景等。与传统的图像生成模型相比,DALL·E模型可以生成更加丰富和多样化的图像,同时还可以生成符合逻辑和语义的图像。

DALL·E模型的训练数据来自于多个来源,包括网络上的图像、图像数据库以及自然语言描述。模型使用这些数据来学习如何将语言描述转换为图像,并在训练过程中不断优化模型的性能。

DALL·E模型可以应用于多个场景,如图像生成、视觉效果、设计和创意等领域。它可以为设计师、艺术家、广告公司等提供更加高效和创新的图像生成工具,同时也可以为普通用户提供更加丰富和多样化的图像内容。

可以通过实验室的界面或API进行试用,DALL·E室验室地址: https://labs.openai.com/ 可以在线体验DALLE的功能。

🌟 Whisper模型
Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过 OpenAI 的 API 使用 whisper-1 模型名称获得。

目前,Whisper 的开源版本与通过 OpenAI 的 API 提供的版本之间没有区别。ChatGPT的Whisper模型是一种基于语音识别和自然语言处理技术的智能语音助手,可以帮助用户实现语音控制、智能问答和语音交互等功能。

Whisper模型采用了深度神经网络和语音识别技术,可以实现高质量的语音识别和语音转换。同时,模型还采用了自然语言处理技术,可以将语音转换为文本,并进行语义分析和理解,从而实现智能问答和语音交互。

Whisper模型可以应用于多个场景,如智能家居、智能客服、语音搜索等领域。它可以为用户提供更加便捷和高效的语音控制和交互方式,同时也可以为企业提供更加智能和人性化的客服和搜索服务。

提示:可以使用Whiper这种模型,为语音生成文本,这在视频生成字幕方面,语音识别等领域将会有很多相关应用。

🌟 Embeddings 模型
ChatGPT的Embeddings模型是一种自然语言处理技术,可以将自然语言文本转换为向量表示,从而实现自然语言文本的语义分析和文本分类等任务。

Embeddings模型采用了深度学习和神经网络技术,通过学习自然语言文本的上下文关系,将文本转换为向量表示。这种向量表示可以捕捉文本的语义信息和上下文关系,从而实现文本的语义分析和文本分类等任务。

Embeddings模型可以应用于多个场景,如文本分类、情感分析、实体识别等领域。它可以为企业提供更加精准和智能的文本分类和情感分析服务,同时也可以为用户提供更加个性化和智能的文本推荐和搜索服务。

总之,ChatGPT的Embeddings模型是一种强大的自然语言处理技术,可以将自然语言文本转换为向量表示,为文本分类、情感分析和实体识别等任务提供更加精准和智能的解决方案。

🌟 Codex 模型
Codex 模型是可以自然语言理解的和生成代码的 GPT-3 模型的后代。他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。

他们最擅长 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。

OpenAI目前提供两种 Codex 型号:

最新模型    描述    最大 TOKENS    训练日期
code-davinci-002    功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。
除了补全代码,还支持在代码中插入补全。    8001 tokens    Up to Jun 2021
code-cushman-001    几乎与 Davinci Codex 一样强大,但速度稍快。
这种速度优势可能使其成为实时应用程序的首选。    Up to 2048 tokens    Up to Jun 2021
Codex 模型在有限的测试版期间可以免费使用,并且会降低速率限制。

在此期间,只要符合 OpenAI 的使用政策,OPenAI非常欢迎也非常乐意为这些模型时提供任何反馈,并期待能与官方社区进行更多的互动。

🌟 Moderation 审核模型
还有一种特殊的模型,那就是 “审核模型” 。"审核模型"旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供了查找以下类别内容的分类功能:仇恨、威胁、自残、性、未成年人、暴力图片。

大家都知道做为一个人工智能,OpenAI 是要禁止那些违反法律,道德,甚至人性底线的提问,这也是一个AI需 要遵守的基本底线。

审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

模型    描述
text-moderation-latest    最有能力的审核模型。精度会比稳定模型略高
text-moderation-stable    几乎与最新型号一样强大,但稍旧一些。
⭐ 持续的模型升级
随着 gpt-3.5-turbo 的发布,OpenAI 的一些模型现在正在不断更新。为了减少模型更改以意外方式影响我们用户的可能性,官方将提供在 3 个月内保持静态的模型版本。随着模型更新的新节奏,OPenAI官方还希望人们能够贡献更多的评估,以帮助他们针对不同的用例改进模型。

以下模型是将在指定日期弃用的临时快照。如果想使用最新的模型版本,请使用标准模型名称,如 gpt-4 或 gpt-3.5-turbo。

模型名称    弃用日期
gpt-3.5-turbo-0301    June 1st,2023
gpt-4-0314    June 14th,2023
gpt-4-32k-0314    June 14th,2023
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/16825.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

07 Kubernetes 网络与服务管理

课件 Kubernetes Service是一个抽象层,用于定义一组Pod的访问方式和访问策略,其作用是将一组Pod封装成一个服务,提供一个稳定的虚拟IP地址和端口号,以便于其他应用程序或服务进行访问。 以下是Kubernetes Service YAML配置文件的…

transformer and DETR

RNN 很难并行化处理 Transformer 1、Input向量x1-x4分别乘上矩阵W得到embedding向量a1-a4。 2、向量a1-a4分别乘上Wq、Wk、Wv得到不同的qi、ki、vi(i{1,2,3,4})。 3、使用q1对每个k(ki)做attention得到a1,i(i{1,2,3,4…

项目经理在项目中是什么角色?

有人说,项目经理就是一个求人的差事,你是在求人帮你做事。 有人说,项目经理就是一个与人扯皮的差事,你要不断的与开发、产品、测试等之间沟通、协调。 确实,在做项目的时候,有的人是为了完成功能&#x…

( 数组和矩阵) 769. 最多能完成排序的块 ——【Leetcode每日一题】

❓769. 最多能完成排序的块 难度:中等 给定一个长度为 n 的整数数组 arr ,它表示在 [0, n - 1] 范围内的整数的排列。 我们将 arr 分割成若干 块 (即分区),并对每个块单独排序。将它们连接起来后,使得连接的结果和按升序排序后…

1. 先从云计算讲起

本章讲解知识点 什么是云计算? 为什么要用云计算? 物理服务器与云服务器对比 云计算服务类型 云计算部署类型 1. 什么是云计算? 云计算是一种通过计算机网络以服务的方式提供动态可伸缩的虚拟化资源的计算模式。按照服务层次分为IaaS、…

Nautilus Chain 测试网第二阶段,推出忠诚度计划及广泛空投

随着更多的公链底层面向市场,通过参与早期测试在主网上线后获得激励成为了行业的一个热点话题,在 Apots、Arbitrum One、Optimism等陆续发放了测试空投后,以 Layer3为主要特性的 Nautilus Chain 也在前不久明确表示将会有空投,引发…

ESP8266_RTOS_SDK之SPIFFS

需要在ESP8266的FLASH中存储一些可变参数,有两种方式,一种是调用SPI Flash API直接指定地址读写FLASH;二是在SPI FLASH上创建一块SPIFFS 分区,以读写文件的形式存取数据。 下面记录第二种方式,使用SPIFFS文件系统存取…

【Unity入门】20.三维向量

【Unity入门】三维向量 大家好,我是Lampard~~ 欢迎来到Unity入门系列博客,所学知识来自B站阿发老师~感谢 (一)空间向量 (1)什么是三维向量 为什么会有这么一篇博客呢?主要是三维向量在unity中…

数据库之事务隔离级别详解

事务隔离级别详解 一、事务的四大特性(ACID)1. 原子性(atomicity):2. 一致性(consistency):3. 隔离性(isolation):4. 持久性(durability): 二、事务的四种隔离级别1. 读未提交(Read uncommitted)&#xff1…

吧佬联手抵制奸商,百元级游戏电脑横出江湖

最近小忆闲得在电商平台搜索了下关键词「游戏主机」,不出意外销量榜前列清一色全是「i9 级高端游戏主机」。 这些主机不论配置单介绍还是十万百万级销量宣传标语,都给人一种血赚不亏的「豪华」感。 咱就说时代在变,唯一不变的是奸商们的套路与…

指针函数和函数指针

本文目录 • 前言 • 一、返回指针的函数 二、指向函数的指针回到顶部 一、返回指针的函数 指针也是C语言中的一种数据类型,因此一个函数的返回值肯定可以是指针类型的。 返回指针的函数的一般形式为:类型名 * 函数名(参数列表) 比如下面这个函数&#…

「Codeforces」771-div2 E. Colorful Operations

E. Colorful Operations https://codeforces.com/contest/1638/problem/E 题目描述 给你一个数组,默认初始元素为 0 ,颜色为 1,有三种操作: Color l r c:将 [l, r] 区间内的颜色修改为 cAdd c x:将所有颜…

SpringBoot整合Minio,一篇带你入门使用Minio

本文介绍SpringBoot如何整合Minio,解决文件存储问题 文章目录 前言环境搭建项目环境搭建添加依赖库yml配置 Docker安装minio 代码实现MiniConfigservicecontroller 测试 前言 参考链接: 官网 环境搭建 项目环境搭建 将minio单独封装成一个module&am…

LeetCode单链表OJ题目做题思路分享

目录 移除链表元素链表的中间节点链表中倒数第K个节点合并两个有序链表 移除链表元素 链接: link 题目描述: 思路分享: 我们上个博客分享了第一种方法,下面我们分析第二种方法:思路就是将每一个不等于我们要删除的值的节点依次尾…

如何快速获取已发表学术论文的期刊封面及目录(caj格式下载和caj转pdf)

目录 1 下载caj格式的封面和目录 2 CAJ格式的封面和目录转PDF格式 在进行职称评审或成果申报时,一般要求提交你发表的成果所在的期刊的当期封面和目录。本文就手把手带带你制作一个期刊目录。 重要提示:下载期刊封面和目录需要你有知网账号&#xff0…

Java读取Properties配置文件的6种方式

Java读取Properties的方式 项目结构:经典的maven项目结构 配置文件1和2内容一致: jdbc.drivercom.mysql.cj.jdbc.Driver jdbc.urlmysql://localhost:3306/database?useUnicodetrue&characterEncodingutf-8&serverTimezoneAsia/Shanghai jdbc.…

【深度学习】计算机视觉(13)——模型评价及结果记录

1 Tensorboard怎么解读? 因为意识到tensorboard的使用远不止画个图放个图片那么简单,所以这里总结一些关键知识的笔记。由于时间问题,我先学习目前使用最多的功能,大部分源码都包含summary的具体使用,基本不需要自己修…

找高清无水印视频素材,就上这9个网站。

推荐几个我的视频素材库,有免费、收费、商用,希望对大家有帮助! 1、菜鸟图库 https://www.sucai999.com/video.html?vNTYwNDUx 菜鸟图库可以找到设计、办公、图片、视频、音频等各种素材。视频素材就有上千个,全部都很高清&…

unityt光线透射目标

介绍 在Unity中,光线透射目标通常指的是在场景中放置的一些物体,用于模拟光线从一个物体透过到另一个物体的效果。canvas子物体组件中,勾不勾选“光线透射目标”有什么区别? 方法 在Canvas子物体组件中勾选“光线透射目标”时&…

Python基础合集 练习17(类与对象)

class Dog: pass papiDog() print(papi) print(type(papi)) 构建方法 创建类过后可以定义一个特殊的方法。在python中构建方法是__init__(),init()必须包含一个self参数 class pig(): #def__init__(self) -> None: print(‘你好’) pipgpig() 属性和方法 cl…
最新文章