全球首个完全开源的指令跟随大模型;T5到GPT-4最全盘点

23d935836c939989f5c923416e1c2ecc.jpeg

1. Dolly 2.0:世界上第一个完全开源的指令跟随LLM

两周前,Databricks发布了类ChatGPT的大型语言模型 (LLM)Dolly,其训练成本不到 30 美元。今天,他们发布了 Dolly 2.0,这是业内第一个开源的指令跟随LLM,并根据高质量的人类生成的指令数据集(15000个prompt/response pairs)进行了微调。Dolly 2.0 基于EleutherAI pythia模型系列,是一个具有12B参数的语言模型。

他们正在完全开源 Dolly 2.0,包括训练代码、数据集和模型权重,这些都可以商用。这意味着,任何组织都可以创建、拥有和定制强大的 LLM,并且无需支付 API 访问费用或与第三方共享数据。

链接:
1. https://huggingface.co/databricks;
2. https://www.databricks.com/blog/2023/04/12/dolly-first-open-commercially-viable-instruction-tuned-llm

2. 大型语言模型综述全新出炉:从T5到GPT-4最全盘点

考虑到 LLMs 的快速技术进步,中国人民大学的二十几位研究者通过背景知识、关键发现和主流技术等三方面回顾了 LLMs 的最新进展,尤其关注 LLMs 的预训练、自适应调优、使用和能力评估。此外他们还总结和开发 LLMs 的可用资源,讨论了未来发展方向等问题。对于领域内研究人员和工程师而言,这份综述是一份极其有用的学习资源。

链接:

https://mp.weixin.qq.com/s/7HRr55Md2Wl6EHQMGioumw

3. OpenAI创始人:GPT-4的研究起源和构建心法

GPT模型所取得的成就令人艳羡,不过这建立在OpenAI数年的技术探索和坚定信念上。作为深度参与了GPT模型从0到1生产过程,以及推动GPT研究和工程落地的主要“幕后推手”,Brockman对此深有体会,“它并非试图像快速致富那样昙花一现,而是一直在缓慢积累价值,才有了指数级增长带来的巨大回报。”

链接:

https://mp.weixin.qq.com/s/hO1ZdqgOjpA328luobQ9eg

4. ChatGPT作者John Schulman:我们成功的秘密武器

新增的对话数据固然重要,不过,让ChatGPT更容易推断出用户的意图,产生质变的根本原因是已在InstructGPT使用的“人类反馈的强化学习(RLHF)”技术,OpenAI联合创始人、研究科学家John Schulman认为,RLHF才是ChatGPT的秘密武器(secret sauce)。本文中,我们可以看到ChatGPT技术演进的脉络和不曾在论文中被描述的细节,以及OpenAI团队的下一步研究方向。

链接:

https://mp.weixin.qq.com/s/sDeBYMvAwbJr5_tj7Q20-w

5. 千亿参数开源大模型BLOOM背后的技术

近年来,语言模型越训越大已成为常态。大家通常会诟病这些大模型本身的信息未被公开以供研究,但很少关注大模型训练技术这种背后的知识。本文旨在以 1760 亿参数的语言模型 BLOOM 为例,阐明训练此类模型背后的软硬件工程和技术要点,以促进大家对大模型训练技术的讨论。

链接: 

https://zhuanlan.zhihu.com/p/615839149

6. 分布式训练的十大常见错误和解决方案

大型语言模型 (LLM)时代,分布式训练势在必行,因为数据和模型权重很少能同时放到一张卡上。然而,ML 中的分布式训练非常复杂且容易出错,其中隐藏着许多陷阱,可能会在模型训练过程中引发巨大问题。本文将介绍分布式模型训练中十个最常见的错误,并将针对每个错误提出解决方案。

链接:
https://neptune.ai/blog/distributed-training-errors

6.5. AutoGPT太火了,无需人类插手自主完成任务


近日,AI 界貌似出现了一种新的趋势:自主人工智能。这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉前 AI 总监、刚刚回归 OpenAI 的 Andrej Karpathy 也为其大力宣传,并在推特赞扬:「AutoGPT 是 prompt 工程的下一个前沿。」


链接:

https://mp.weixin.qq.com/s/bV1tPc7hNn2z06YOpzyanw

7. 理解大型语言模型(入门阅读清单)

由于Transformer对每个人的研究工作产生了如此大的影响,作者罗列了一个阅读清单供机器学习研究人员和从业者入门LLM。

链接:
https://sebastianraschka.com/blog/2023/llm-reading-list.html?

8. 大模型汇总(10亿级参数规模以上)

大模型(大型语言模型,LLMs)是当下AI和NLP研究与产业中最重要的方向之一。本文将对当下的主流大模型进行总结。参数规模在1B以上的模型视为大模型。

链接:
https://zhuanlan.zhihu.com/p/611403556

9. ML系统入门资料整理(tvm&mlir&llvm)

对于想入门mlsys或者想深入学习某种编译器的开发者来说,希望这个资料可以成为不错的起点。

链接:
https://zhuanlan.zhihu.com/p/618229430

10. 谈谈对OpenAI Triton的一些理解

Triton应该算是笔者看到的基于MLIR编译技术路径实现,性能和功能均可满足一部分实际需求且得到了生产检验,并且在主流AI加速器上解决了计算密集算子开发需求的第一个开源工作。

链接:
https://zhuanlan.zhihu.com/p/613244988

11. mperf:移动/嵌入式平台算子性能调优利器

在移动/嵌入式平台,为了最大程度发挥硬件算力,对算子极致性能的追求变成必然,不同于桌面/服务器平台,移动/嵌入式平台在算子性能调优方面可选择的工具很少。mperf 是一个微架构层次的算子性能调优工具箱,主要面向移动/嵌入式平台的 CPU/GPU 核心,目标是“为构建一个更接近闭环的算子调优反馈回路”提供系列基础工具。

链接:
https://zhuanlan.zhihu.com/p/610346564

12. 小型Python编译器项目入门

适合对编译优化、高性能计算、GPU编程感兴趣,完全零基础的同学也没问题,但是需要熟悉Python编程。

编译器和测试部分代码完全用Python编写,算子的部分使用cupy的rawKernel功能将cuda代码编译成一个Python函数。目前已完成了第一个模块的代码部分,共分为5天,每一天的所有代码加起来不超过100行,简单易懂。

链接:
https://zhuanlan.zhihu.com/p/603352525

13. CUDA编程:常用技巧/方法

不管你是在学习CUDA,还是在优化算子,掌握一些CUDA编程技巧,能够提升你的工作效率,甚至找到更优解。本文主要是介绍一些常用的技巧/方法,并配上实践code,希望对读者有所帮助。

链接:
https://zhuanlan.zhihu.com/p/584501634

14. NCCL源码解析①:初始化及ncclUniqueId的产生

NCCL是英伟达开源的GPU通信库,支持集合通信和点对点通信。

链接:

https://mp.weixin.qq.com/s/_SOmkGoo9DblXb8ddyEeaQ

15. 适配PyTorch FX,OneFlow让量化感知训练更简单

OneFlow紧随其后添加了针对OneFlow的fx,即One-fx,在安装One-fx之后,用户可以直接调用oneflow.fx,也可以直接通过import onefx as fx进行使用。

链接:

https://mp.weixin.qq.com/s/O8yGUuTL-o_gHQV4xez_nQ

16. One-YOLOv5 v1.2.0发布:支持分类、检测、实例分割

新版本同步了Ultralytics YOLOv5的上游分支v7.0,同时支持分类、目标检测、实例分割任务;支持flask_rest_api;支持使用 wandb 对实验跟踪和可视化功能;oneflow_hub_support_pilimage;为每个batch的compute_loss部分减少一次h2d和cpu slice_update操作 ;优化 bbox_iou 函数和模型滑动平均部分,大幅提升训练性能;

兼容FlowFlops,训练时可以展示模型的FLOPs 


链接:

https://mp.weixin.qq.com/s/bkEkInaF7Ht7KsdXUFkw-Q

其他人都在看

  • “ChatGPT们”的淘金时代

  • 大型语言模型的推理演算

  • GPT-4创造者:第二次改变AI浪潮的方向

  • 谷歌科学家:ChatGPT秘密武器的演进与局限

  • 比快更快,开源Stable Diffusion刷新作图速度

  • OneEmbedding:单卡训练TB级推荐模型不是梦

  • GLM训练加速:性能最高提升3倍,显存节省1/3

欢迎Star、试用OneFlow: github.com/Oneflow-Inc/oneflow/icon-default.png?t=N2N8http://github.com/Oneflow-Inc/oneflow/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/11803.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

gdb 跟踪调式core

自己编译的问题出现段错误: 编译:使用gdb调试core文件来查找程序中出现段错误的位置时,要注意的是可执行程序在编译的时候需要加上-g编译命令选项。 gdb调试core文件的步骤 gdb调试core文件的步骤常见的有如下几种,推荐第一种。 具体步骤一: (1)启动gdb,进入core文…

Midjourney详细注册和使用教程

来源:Midjoureny详细注册使用教程【探索ChatGPT】 Midjourney,用户只需要输入一段图片的文字描述,即可生成精美的绘画,相信了解Midjourey的小伙伴已经对它强大之处而赞叹! 下面是用通俗易懂的步骤教会大家如何注册和…

企业网站架构部署与优化

系列文章目录 文章目录系列文章目录一、LAMP概述与简介1.LAMP2.各组件的主要作用如下:二、1.编译安装Apache http服务2.编译安装 Mysql 服务3.编译安装 PHP 解析环境总结一、LAMP概述与简介 1.LAMP LAMP架构是目前成熟的企业网站应用模式之一,指的是协…

Linux内核之网络协议栈以及套接字sk_buff分析

网络协议栈以及套接字sk_buff分析一、Linux 内核网络协议栈构架二、网络协议栈常见的数据结构2.1、TCP/IP 参考模型及 ISO/OSI 参考模型2.2、套接字 sk_buff 分析2.3、套接字缓冲区管理数据2.4、Linux 内核提供套接字缓冲区标准 API 函数2.5、使用一个表头来实现套接字缓冲区的…

Scala - 时间工具类 LocalDateTime 常用方法整理

目录 一.引言 二.LocalDateTime 获取与格式化 1.获取当前时间 LocalDateTime 2.根据时间戳获取 LocalDateTime 3.指定时间获取 LocalDataTime 4.LocalDataTime 格式化 三.LocalDateTime 读取时间细节 1.获取年-Year 2.获取月-Month 3.获取日-Day 4.获取时-Hour 5.获…

一文读懂域名注册

本文深入浅出讲解域名的注册、建站和管理,通过文章可以了解以下问题: 域名注册及建站流程;域名注册的技术原理;域名管理(修改 DNS 服务器、转入转出、自定义 DNSHost、whois 信息)。 众所周知,…

轨迹相似度整理

1 基于点之间的距离 1.1 欧几里得距离 优点:线性计算时间缺点:轨迹长度必须一样 1.2 DTW DTW 笔记: Dynamic Time Warping 动态时间规整 (&DTW的python实现) 【DDTW,WDTW】_UQI-LIUWJ的博客-CSDN博客 …

限流算法(计数器、滑动时间窗口、漏斗、令牌)原理以及代码实现

文章目录前言1、计数器(固定时间窗口)算法原理代码实现存在的问题2、滑动时间窗口算法原理代码实现存在的问题3、漏桶算法原理代码实现存在的问题4、令牌桶算法原理代码实现最后本文会对这4个限流算法进行详细说明,并输出实现限流算法的代码示…

【Redis笔记03】Redis运行环境之Cluster集群模式

这篇文章,主要介绍Redis运行环境之Cluster集群模式。 目录 一、Cluster集群模式 1.1、集群模式原理 (1)普通集群 (2)什么是分片??? (3)如何分片存储&…

【操作系统复习】第4章 进程同步

进程同步的概念 主要任务 ➢ 使并发执行的诸进程之间能有效地共享资源和相互合作,从而使程序的执行具有可再现性。 进程间的制约关系 ➢ 间接相互制约关系(互斥关系) • 进程互斥使用临界资源 ➢ 直接相互制约关系(同步关系) •…

在线绘制思维导图

思维导图是一种可视化的思维工具,它可以将放射性思考具体化为可视的图像和图表。 思维导图利用图文并重的技巧,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接。 它运用图像和颜色等多种元素&…

真题详解(Flynn分类)-软件设计(四十六)

真题详解(计算机总线)-软件设计(四十五)https://blog.csdn.net/ke1ying/article/details/130046829 Flynn分类将计算机分为四类。 单指令流单数据流机器(SISD):早期的机器,在某个时钟周期&…

某程序员哀叹:月薪四五万,却每天极度焦虑痛苦,已有生理性不适,又不敢裸辞,怎么办?...

高薪能买来快乐吗?来看看这位程序员的哀叹:实在是扛不住了,每天都在极度焦虑和痛苦中度过,早上起来要挣扎着做心理建设去上班,已经产生生理性的头晕恶心食欲不振。有工作本身的原因,更多是自己心态的问题&a…

商务接待广州考斯特商务租车详解!

进入四月份以来,全国各个地区都有很多商务活动举办,广州也不例外,广州很多地区都有商务活动的需求。因此不少主办方都需要商务租车来接待客户,而丰田考斯特是市面上常见的一款高端中巴车,主要是因为考斯特的可靠性、安…

CentOs的环境和配置

centos如果我们想要登录怎么办? 我们可以使用Xshell的远程登录 就像这样 这个就是Xshell远程登录,我们可以ssh root你的主机ip 然后输入密码就可以登录 就像这样 然后输入你的密码 就登录上来了,然后就可以进行你的操作 但是我们还可以直…

Flink 优化 (一) --------- 资源配置调优

目录一、内存设置1. TaskManager 内存模型2. 生产资源配置示例二、合理利用 cpu 资源1. 使用 DefaultResourceCalculator 策略2. 使用 DominantResourceCalculator 策略3 使用 DominantResourceCalculator 策略并指定容器 vcore 数三、并行度设置1. 全局并行度计算2. Source 端…

谷歌云服务器centos9的docker部署chat-web,实现自己的ChatGPT

谷歌云服务器centos9的docker部署chat-web,实现自己的ChatGPT 前提条件:准备一个境外服务器和chatgpt的key。(网上教程很多) 1.更新yum yum update2.下载docker-ce的repo curl https://download.docker.com/linux/centos/dock…

【iOS开发-响应者链Responder Chain】

文章目录0.0 前言1 响应者链(Responder Chain1.1 响应者1.2 响应链事件1.3 响应者对象1.3.1 常见的响应者对象1.3.3 UIResponder1.3 UITouch1.3.1 UITouch的属性1.3.2 UITouch的方法1.4 UIEvent1.4.2 获取touch1.5 完整的响应者链1.5.1寻找响应者的hitTest方法1.5.2…

excel在文本的固定位置插入字符、进行日期和时间的合并

1.excel在文本的固定位置插入字符 如上图,现在想要将其转化为日期格式(比如2017/1/1),但是当设置单元格格式为日期时却显示出很多#。我们可以通过在20170101中添加两个斜杠“/”来将其转化为2017/1/1。可以用replace函…

【分享】如何移除PDF密码?

相信不少小伙伴在工作的时候,经常会为了保证PDF文档的安全和私密而给文件设置“打开密码”,但如果后续需要频繁使用该文件,每次打开都要查找输入密码,就会使得工作效率大大降低耽误工作时间。那后续不需要设置保护了,要…
最新文章