读懂ChatGPT需要掌握哪些知识

ChatGPT的知识主要涉及自然语言处理和强化学习。自然语言处理的历史发展脉络是从词向量到RNN、注意力、Transformer、GPT、ChatGPT等。

第一章 自然语言处理概述

1.1.什么是自然语言处理
人工智能一个重要分支
1.1.1.机器学习、人工智能
1.1.2.自然语言处理
1.2.自然语言处理应用场景
1.2.1.文本分类与分析
1.2.2.翻译
1.2.3.智能问答
1.3.自然语言处理发展历程
1.3.1.深度学习之前
统计语言模型、TF-IDF
1.3.2.深度学习时代
从词向量到RNN、注意力、Transformer、GPT、ChatGPT。
1.4.自然语言处理流水线
1.4.1.数据预处理
1.4.2.构建模型
1.4.3.实验评估
1.5.小结

第二章 词向量

2.1.构建词汇表
2.2.Token
2.3.词的One-hot表示
2.4.词的向量表示(Embedding)
2.5.小结

第三章 初识自然语言处理神经网络

3.1.一个NLP神经网络例子
3.1.1.如何进行文本分类
先来一个简单的文本分类神经网络例子。词向量输入分类函数。
3.1.2.分类函数
单分类、多分类。
3.2.神经网络
3.2.1.神经网络概述
3.2.2.目标函数
3.2.3.神经元
3.2.4.梯度
梯度消失(gradient vanishing)和梯度爆炸(gradient explosion)
3.2.5.反向传播
3.2.6.训练、验证与预测
3.3.小结

第四章 自然语言处理的训练方法

4.1.监督学习
4.2.非监督学习
Zero-Shot
4.3.半监督学习
Few-Shot (FS)、One-Shot (1S)、
4.3.1.预训练
4.3.2.微调
4.4.小结

第五章 循环神经网络

5.1.RNN
5.1.1.RNN简介
5.1.2.LSTM简介
遗忘门、更新门、输出门
5.1.3.GRU简介
5.1.4.使用RNN进行文本分类
文本分类
5.2.5.2 seq2seq模型
5.2.1.seq2seq模型概述
5.2.2.编码器Encoder

5.2.3.解码器Decoder
5.2.4.智能问答:seq2seq例子
5.3.5.3 小结

第六章 注意力机制的兴起

6.1.注意力机制
6.1.1.注意力机制的起源
6.1.2.注意力机制的原理
6.1.3.注意力机制的好处
6.2.seq2seq与注意力机制的结合
6.2.1.RNNsearch
6.2.2.全局注意力与局部注意力
6.3.智能问答:seq2seq与注意力机制的例子
6.4.小结

第七章 纯注意力模型Transformer

7.1.Transformer整体结构
7.2.自注意力机制
7.3.多头注意力机制
7.4.位置编码
7.5.Decoder
7.6.Encoder
7.7.智能问答:Transformer例子
7.8.小结

第八章 GPT

8.1.GPT-1
8.1.1.GPT-1模型结构
8.1.2.预训练阶段
8.1.3.微调阶段
8.1.4.训练资源与时间
8.1.5.使用GPT-1进行智能问答
8.2.GPT-2
8.2.1.GPT-2与GPT-1的差异
8.2.2.训练资源与时间

8.3.GPT-3
8.3.1.GPT-3概述
8.3.2.Few-Shot (FS)
8.3.3.One-Shot (1S)
8.3.4.Zero-Shot
8.3.5.训练资源与时间

8.4.GPT-3.5
8.4.1.GPT-3.5概述
8.4.2.GPT-3.5的写代码能力
8.5.GPT的竞争对手
8.5.1.AR与AE模型
8.5.2.BERT系列模型
Autoregressive(AR)语音模型和Autoencoding(AE)

8.6.小结

第九章 强化学习

9.1.强化学习概述
9.1.1.强化学习基本概念
9.1.2.强化学习都有哪些
9.1.3.基于策略的强化学习
9.1.4.基于价值的强化学习
9.1.5.演员-评论家的强化学习

9.2.ChatGPT中的强化学习
ChatGPT使用的强化学习方法是PPO,同时PPO目前也是OpenAI团队默认的强化学习方法。从基于策略的方法发展出了TRPO算法,接着是PPO算法。

9.2.1.TRPO算法

9.2.2.PPO算法
OpenAI 默认的强化学习算法

9.3.强化学习应用于智能问答

第十章 InstructGPT

10.1.InstructGPT模型基本结构
10.2.InstructGPT的监督预训练
10.3.InstructGPT的奖励模型
10.4.InstructGPT的强化学习
10.5.InstructGPT训练资源与时间

10.6.InstructGPT实验结果
10.7.小结

第十一章 ChatGPT

11.1.ChatGPT与InstructGPT差异
11.2.ChatGPT的优势
11.3.ChatGPT的不足
11.4.ChatGPT体验
11.5.ChatGPT的应用场景
11.6.ChatGPT的未来发展
11.7.小结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/4275.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Mysql-缓冲池 buffer pool

缓冲池 buffer pool innodb中的数据是以【页】的形式存储在磁盘上的表空间内,但是【磁盘的速度】和【内存】相比简直不值一提,而【内存的速度】和【cpu的速度】同样不可同日而语,对于数据库而言,I/O成本永远是不可忽略的一项成本…

基于Elman神经网络预测计费系统的输出(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 简单循环网络(simple recurrent networks,简称SRN)又称为Elman network,是由Jeff…

什么是AI文章生成器-AI文章生成器批量生成文章

AI文章生成器有哪些 目前市面上存在一些可以生成文章的 AI 文章生成器,以下是其中几种常见的: OpenAI GPT-3: OpenAI GPT-3 是目前最先进、最著名的 AI 文章生成器之一,它可以生成各种类型的文章,例如新闻报道、科学报…

我的Macbook pro使用体验

刚拿到Mac那一刻,第一眼很惊艳,不经眼前一亮,心想:这是一件艺术品,太好看了吧 而后再体验全新的Macos 系统,身为多年的win用户说实话一时间还是难以接受 1.从未见过的访达,不习惯的右键 2. …

[论文解析] Cones: Concept Neurons in Diffusion Models for Customized Generation

论文连接:https://readpaper.com/pdf-annotate/note?pdfId4731757617890738177&noteId1715361536274443520 源码链接: https://github.com/Johanan528/Cones 文章目录OverviewWhat problem is addressed in the paper?Is it a new problem? If so…

PMP一般要提前多久备考?

PMP很迷,有只备考了一周过的,也有备考几个月过的。保险起见,预留两个月比较靠谱,尤其现在是新考纲,PMP新版大纲加入了 ACP 敏捷管理的内容,而且还不少,敏捷混合题型占到了 50%,前不久…

AcWing3662. 最大上升子序列和(线性DP + 树状数组优化 + 离散化处理)

AcWing3662. 最大上升子序列和(线性DP 树状数组优化 离散化处理)一、问题二、分析1、DP过程(1)状态表示(2)状态转移2、数据结构优化(1)树状数组维护最值(2)…

K8s 弃用 Docker!一文介绍 containerd ctr、crictl 使用

containerd 是一个高级容器运行时,又名 容器管理器。简单来说,它是一个守护进程,在单个主机上管理完整的容器生命周期:创建、启动、停止容器、拉取和存储镜像、配置挂载、网络等。 containerd 旨在轻松嵌入到更大的系统中。Docke…

【ASPLOS 2023】图神经网络统一图算子抽象uGrapher,大幅提高计算性能

作者:周杨杰、沈雯婷 开篇 近日,阿里云机器学习平台PAI和上海交通大学冷静文老师团队合作的论文《图神经网络统一图算子抽象uGrapher》被ASPLOS 2023录取。 为了解决当前图神经网络中框架中不同的图算子在不同图数据上静态kernel的性能问题&#xff0…

【前沿技术】文心一言 PK Chat Gpt

目录 写在前面 一、文心一言 二、Chat GPT 三、对比 四、总结 写在前面 随着人工智能技术的不断发展和普及,越来越多的智能应用走入了人们的日常生活,如智能语音助手、智能客服、机器翻译等等。在这些应用中,自然语言生成(…

看完不再愁 | 图解TCP 重传、滑动窗口、流量控制、拥塞控制

目录 前言 正文 🌲 重传机制 1. 超时重传 2. 快速重传 3. SACK 方法 4. Duplicate SACK 🌲 滑动窗口 🌳 流量控制 🌳 拥塞控制 1. 慢启动 2. 拥塞避免算法 3. 拥塞发生 4. 快速恢复 前言 前面我们讲到「硬不硬你说…

Android开发一直在用大公司的开源库,可参考~

一、阿里巴巴 (一)UI有关 1. 多页面切换场景统一解决方案 UltraViewPager UltraViewPager 是阿里开源的一个封装多种特性的 ViewPager ,主要是为多页面切换场景提供统一解决方案。 主要功能: 1. 支持横向滑动/纵向滑动2. 支持一屏…

求红白黑球的个数-课后程序(JavaScript前端开发案例教程-黑马程序员编著-第2章-课后作业)

【案例2-11】求红白黑球的个数 一、案例描述 考核知识点 for循环语句、if判断语句 练习目标 掌握for循环应用。掌握if判断语句应用 需求分析 用js编程 已知:红白球共25个,白黑球共31个,红黑球共28个,求三种球各有多少&#xff…

基于STM32 SG90 9g舵机控制

文章目录一、什么是舵机?二、工作原理三、利用PWM控制四、stm32舵机控制一、什么是舵机? 产品参数 名称:9克舵机180度 尺寸:23mm X 12.2mm X 29mm 重量:9克 扭矩:1.5kg/cm 工作电压:4.2 - 6V 温…

Java大数字运算(BigInteger类和BigDecimal类)

在 Java 中提供了用于大数字运算的类,即 java.math.BigInteger 类和 java.math.BigDecimal 类。这两个类用于高精度计算,其中 BigInteger 类是针对整型大数字的处理类,而 BigDecimal 类是针对大小数的处理类。 BigInteger 类 如果要存储比 …

一本通 3.3.1 树与二叉树

树与二叉树的基本知识 1336&#xff1a;【例3-1】找树根和孩子 【题目描述】 给定一棵树&#xff0c;输出树的根root&#xff0c;孩子最多的结点max以及他的孩子。 【题目分析】 【代码实现】 #include<bits/stdc.h> using namespace std; int father[201], sum[101]…

8.OSP的GR(Graceful Restart,平滑重启)实验

一、GR(Graceful Restart,平滑重启) 技术介绍 GR(Graceful Restart,平滑重启)技术保证了设备在重启过程中转发层面能够继续指导数据的转发,同时控制层面邻居关系的重建以及路由计算等动作不会影响转发层面的功能,从而避免了路由振荡引发的业务中断,保证了关键业务的数…

Java_Spring:5. 基于注解的 IOC 配置

目录 1 环境搭建 1.1 第一步&#xff1a;拷贝必备 jar 包到工程的 lib 目录。 1.2 第二步&#xff1a;使用Component 注解配置管理的资源 1.3 第三步&#xff1a;创建 spring 的 xml 配置文件并开启对注解的支持 2 常用注解 2.1 用于创建对象的注解 2.1.1 Component 2.1…

【MySQL高级篇】第09章_性能分析工具的使用

第09章_性能分析工具的使用 在数据库调优中&#xff0c;我们的目标是 响应时间更快, 吞吐量更大 。利用宏观的监控工具和微观的日志分析可以帮我们快速找到调优的思路和方式。 1. 数据库服务器的优化步骤 当我们遇到数据库调优问题的时候&#xff0c;该如何思考呢&#xff1…

在vue项目中使用echarts(echarts不显示,echarts使用详细)

简述&#xff1a;我们在写大屏项目和vue项目时经常会用到echarts&#xff0c;用于数据统计和可视化&#xff0c;它是一款基于JavaScript的数据可视化图表库&#xff0c;提供直观&#xff0c;生动&#xff0c;可交互&#xff0c;可个性化定制的数据可视化图表&#xff0c;下面分…
最新文章