ChatGPT学习研究总结

目录

ChatGPT研究总结

一、程序接入用途不大

二、思考:如何构建一个类似ChatGPT的自定义模型

一些ChatGPT研究学习资料(来源网络)

(1)一文读懂ChatGPT模型原理

(2)MATLAB科研图像处理——基于ChatGPT编程

(3)ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于先进AI技术深度解读)

(4)程序员浅用ChatGPT:替代还很远

(5)用ChatGPT 做硬件设计?

(6)chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南


ChatGPT研究总结

ChatGPT是一种由OpenAI训练的大型语言模型,它可以生成人类语言文本。在编写小段代码、书写描述功能介绍等等方面有一定的帮助,但因为工具本来存在一些错误现象,所以还需要人工审核,用其精华。同时,使用过程中还需注意对结果中可能存在的版权风险。

目前ChatGPT使用中主要存在如下问题:

  1. 慢:因为计算量巨大,速度较慢,通常一个问题需要几分钟才有答案
  2. 错:因为只是文本语言模型分析,存在回答结果错误现象
  3. 广度待提升:模型训练的领域广度还待提升

一、程序接入用途不大

程序接入的用途不大,因为通过sdk只是封装出一个软件界面,核心的计算代码还是部署在服务器上的训练代码,而目前通过微信公众号(ChatChatGPT)等接口输入也能达到使用ChatGPT,所以没有必要来接入程序,做一个“软件壳”,作用不大。

二、思考:如何构建一个类似ChatGPT的自定义模型

例如,能否构建一个压裂监测模型,根据监测的电磁信号来推测压裂缝隙的走向?

关于这个问题,先总监一下 ChatGPT 模型构建中的几个关键点:

1、大数据训练:

  1. 基于2021年所拥有的数据集,预训练数据量可能超过百T级,非常巨大
  2. ChatGPT参数量达到了1750亿,模型设定的参数非常多

2、人工对结果标注
ChatGPT进行了人工标反馈和奖励,以辅助人工智能程序不断优化(进化)

3、训练费用

“GPT-3 模型训练一次需要花费 460 万美元”

见附录:《chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南》一文。

综合这几点,我们可以构建出一个预测压裂监测缝隙的模型,但前提是有足够的数据,也需要人工来验证相应数据的结果,提供充足的资金,来进行模型训练。

一些ChatGPT研究学习资料(来源网络)

(1)一文读懂ChatGPT模型原理

一文读懂ChatGPT模型原理

一文读懂ChatGPT模型原理 - 知乎

不光是做人工智能、机器学习的人关注,而是大量的各行各业从业人员都来关注这个模型,真可谓空前盛世。
所谓语言模型的训练和学习,就是从大量的数据中学习复杂的上下文联系。

与此同时,OpenAI 早于 Bert 出品了一个初代 GPT 模型。

在 NLP 领域,人们使用语言一般包括三个步骤:
接受听到或读到的语言 -> 大脑理解 -> 输出要说的语言。

GPT-3 的模型所采用的数据量之大,高达上万亿,模型参数量也十分巨大,上千亿,学习之复杂,计算之繁复,
如此巨大的模型造就了 GPT-3 在许多十分困难的 NLP 任务,诸如撰写人类难以判别的文章,甚至编写SQL查询语句,React或者JavaScript代码上优异的表现。

ChatGPT 模型上基本上和之前 GPT-3 都没有太大变化,主要变化的是训练策略变了,用上了强化学习。
几年前,alpha GO 击败了柯洁,几乎可以说明,强化学习如果在适合的条件下,完全可以打败人类,逼近完美的极限。
强化学习非常像生物进化,模型在给定的环境中,不断地根据环境的惩罚和奖励(reward),拟合到一个最适应环境的状态。

这里重点是第二步中,如何构建一个 reward 函数,在alpha go 里,这个reward 函数就是下完一盘围棋之后判断谁输谁赢,只需要一个程序函数即可完成。
而在ChatGPT里,具体就是让那40名外包人员不断地从模型的输出结果中筛选,判断哪些句子是好的,哪些是低质量的,这样就可以训练得到一个 reward 模型。

一个语言文字训练的人工智能程序

存在问题:

  1. 仅限于语言标注
  2. 仅限于以前输入到系统中,训练的数据库,如果有新的数据还需要重新添加并训练
  3. 存在编程过程中,答案正确率较低的现象

(2)MATLAB科研图像处理——基于ChatGPT编程

MATLAB科研图像处理——基于ChatGPT编程

MATLAB科研图像处理——基于ChatGPT编程 - 知乎

ChatGPT是一个非常强大的语言模型,但它并不是万能的

(3)ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于先进AI技术深度解读)

ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于先进AI技术深度解读)

ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于GPT-4/ChatGPT技术与产业分析) - 知乎

ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。
其中GPT是Generative Pre-trained Transformer(生成型预训练变换模型)的缩写。

目标是开发造福全人类的AI技术。

每一代GPT模型的参数量都爆炸式增长,堪称“越大越好”。2019年2月发布的GPT-2参数量为15亿,而2020年5月的GPT-3,参数量达到了1750亿。

ChatGPT 是基于GPT-3.5(Generative Pre-trained Transformer 3.5)架构开发的对话AI模型,是InstructGPT 的兄弟模型。ChatGPT很可能是OpenAI 在GPT-4 正式推出之前的演练,或用于收集大量对话数据。

因此它只能基于2021年所拥有的数据集进行回答
ChatGPT 通过算法屏蔽,减少有害和欺骗性的训练输入。

(4)程序员浅用ChatGPT:替代还很远

程序员浅用ChatGPT:替代还很远

程序员浅用ChatGPT:替代还很远|源代码|应用程序|编程语言_网易订阅

李智认为,ChatGPT并不能编写程序员角度的代码,而是从互联网收集庞大信息库并使用它来生成代码,解决问题还是要靠人。
对于软件程序,ChatGPT目前只有通用底层的能力,涉及电商、云服务等业务层面的能力尚有欠缺。比如要写一个小程序,是可以借用ChatGPT来找算法、写代码、写脚本

考虑到会侵犯知识产权。

(5)用ChatGPT 做硬件设计?

用ChatGPT 做硬件设计?

用ChatGPT 做硬件设计? - 知乎

(6)chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南

chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南

chatGPT的49种应用场景介绍,各开发语言接入chatGPT参考指南_Java_非喵鱼_InfoQ写作社区

分析了存在的问题:

  1. 广度待提升

api 注册使用流程
直接用 chatGPT 去创建一个程序要用的秘钥,
就可以使用 http 接口调用了。

程序接入到 chatGPT,所调用的接口,都是收费接口,不过还好的是每一个新注册的账号头 3 个月免费使用,总消费额度不超过 18 美元即可。另外下图 4 个方块就是 nlp 的模型,左边 ada 速度最快,右边达芬奇功能最强大。

转载于:杨杰

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/20545.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

DHCP+链路聚合+NAT+ACL小型实验

实验要求: 1.按照拓扑图上标识规划网络。 2.使用0SPF协议进程100实现ISP互通。 3.私网内PC属于VLAN1O, FTP Server属于VLAN2O,网关分 别为所连接的接入交换机,其中PC要求通过DHCP动态获取 4:私网内部所有交换机都为三层交换机,请合理规划VLAN&#…

带你深入学习k8s--(四) 控制器(k8s核心)

目录 一、概念 1、什么是控制器 2、控制器执行流程 3、控制器类型 二、控制器的使用 1、ReplicaSet 2、Deployment 1、版本迭代 2、回滚 3、修改滚动更新策略 4、暂停与恢复 3、daemonset 4、job 5、cronjob 前言: 上一章我们说到,pod有…

VScode添加右键运行、并设置每次运行前都清屏即去除之前的输出

一、添加右键运行 下载安装运行插件即可 二、运行前清屏 在运行插件中设置 找到Code-runner: Clear Previous Output,把√打上即可

【Linux Network】传输层协议——TCP

目录 TCP协议 TCP协议段格式 确认应答(ACK)机制 超时重传机制 连接管理机制 理解TIME_WAIT状态 解决TIME_WAIT状态引起的bind失败的方法 理解 CLOSE_WAIT 状态 滑动窗口 流量控制 拥塞控制 延迟应答 捎带应答 面向字节流 粘包问题 TCP异常情况 TCP小结 基于TCP应用层协议 TCP/U…

Pytroch nn.Unfold() 与 nn.Fold()图码详解

文章目录 Unfold()与Fold()的用途nn.Unfold()Unfold()与Fold() 变化模式图解 nn.Fold()单通道 滑动窗口无重叠模拟图片数据(b,3,9,9),通道数 C 为3,滑动窗口无重叠。单通道 滑动窗口有重叠。 卷积等价于:Unfold Matri…

【滤波专题-第7篇】“类EMD”算法分解后要怎样使用(3)——EMD降噪方法及MATLAB代码实现

使用EMD分解(以及其他“类EMD”分解方法,以下为了简便统称EMD)做信号降噪,是EMD的一个比较重要的应用方向。EMD可以将复杂的信号分解为一系列的固有模态函数(IMFs),每一个IMF都包含了信号的一部…

ChatGPT:2. 使用OpenAI创建自己的AI网站:1. 初探API

使用OpenAI创建自己的AI网站 如果你还是一个OpenAI的小白,有OpenAI的账号,但想调用OpenAI的API搞一些有意思的事,那么这一系列的教程将仔细的为你讲解如何使用OpenAI的API制作属于自己的AI网站。博主只能利用下班时间更新,进度慢…

【利用AI刷面试题】AI:十道不常见的TypeScript面试题

文章目录 前言😏以下是关于 TypeScript 的一些偏僻的面试题😝1. 泛型约束中的 "extends" 关键字有哪些用法和含义?2. 什么是交叉类型(Intersection Types)?如何在 TypeScript 中定义和使用它们&a…

第N2周:中文文本分类-Pytorch实现

目录 一、前言二、准备工作三、数据预处理1.加载数据2.构建词典3.生成数据批次和迭代器 三、模型构建1. 搭建模型2. 初始化模型3. 定义训练与评估函数 四、训练模型1. 拆分数据集并运行模型 一、前言 🍨 本文为🔗365天深度学习训练营 中的学习记录博客 …

不愧是腾讯 ,问的贼细

腾讯软件测试岗位的面试流程可能会因个人经验和公司而异,但通常情况下,腾讯软件测试的面试分为初试、二面、三面和四面。以下是每一轮面试可能涉及到的问题: 初试: 请介绍一下自己,以及为什么想要加入腾讯软件测试团…

时序预测 | MATLAB实现BO-CNN-LSTM贝叶斯优化卷积神经网络-长短期记忆网络时间序列预测

时序预测 | MATLAB实现BO-CNN-LSTM贝叶斯优化卷积神经网络-长短期记忆网络时间序列预测 目录 时序预测 | MATLAB实现BO-CNN-LSTM贝叶斯优化卷积神经网络-长短期记忆网络时间序列预测效果一览基本介绍模型搭建程序设计参考资料 效果一览 基本介绍 MATLAB实现BO-CNN-LSTM贝叶斯优…

操作系统实验二 进程(线程)同步

前言 实验二相比实验一难度有所提升,首先得先掌握好相应的理论知识(读者-写者问题和消费者-生产者问题),才能在实验中得心应手。任务二的代码编写可以借鉴源码,所以我们要先读懂源码。 1.实验目的 掌握Linux环境下&a…

浅谈Redis

一、Redis的简介 1.开源免费的缓存中间件,性能高,读可达110000次/s,写可达81000次/s。 2.redis的单线程讨论: V4.0之前:是单线程的,所有任务处理都在一个线程内完成. V4.0:引入多线程,异步线程用于处理一些耗…

Linux三种网络模式 | 仅主机、桥接、NAT

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! Linux三种网络模式 仅主机模式:虚拟机只能访问物理机,不能上网 桥接模式:虚拟机和物理机连接同一网络,虚拟机和物理机…

Docker的四种网络模式

1.Host 模式 通常来讲,启动新的Docker容器,都会分配独立的Network Namespace隔离子系统,如果在运行是指定为host模式,那么Docker容器将不会获得一个独立的Network Namespace,而是和宿主机共用一个Network Namespace子…

山东专升本计算机第六章-数据库技术

数据库技术 SQL数据库与NOSQL数据库的区别 数据库管理系统 考点 6 数据库管理系统的组成和功能 组成 • 模式翻译 • 应用程序的翻译 • 交互式查询 • 数据的组织和存取 • 事务运行管理 • 数据库的维护 功能 • 数据定义功能 • 数据存取功能 • 数据库运行管理…

【图像基础知识】常见图像格式

文章目录 1 简介2 RGB3 BGR4 YUV4.1 YUV常见格式4.2 YUV420详解4.3 NV12 5 Gray6 图像格式之间的转换7 参考链接 原文来自于地平线开发者社区,未来会持续发布深度学习、板端部署的相关优质文章与视频,如果文章对您有帮助,麻烦给点个赞&#x…

Sentinel : 服务容错(降级熔断、流量整形)

什么是服务雪崩? 服务雪崩效应是一种因“服务提供者的不可用”(原因)导致“服务调用者不可用”(结果),并将不可用逐渐放大的现象。 我来用一个模拟场景带你感受一下服务雪崩的厉害之处。假设我有一个微服…

20 散列表的查找

散列表的查找 简介:散列表(也成哈希表)是一种高效的数据结构,他可以在平均复杂度为O(1)的情况下实现查找、插入和删除操作。 哈希表的基本思想是根据关键字的值来计算其应存储的位置。这个计算过程就是通过哈希函数来实现的。 根…

深度学习-第T5周——运动鞋品牌识别

深度学习-第T5周——运动鞋品牌识别 深度学习-第T5周——运动鞋品牌识别一、前言二、我的环境三、前期工作1、导入数据集2、查看图片数目3、查看数据 四、数据预处理1、 加载数据1、设置图片格式2、划分训练集3、划分验证集4、查看标签 2、数据可视化3、检查数据4、配置数据集 …