基于 Amazon Bedrock 的 Claude 3 体验:ChatGPT 已经 OUT 了吗?Claude 3 数据实测

文章目录

  • 前言
  • 一、Claude 3 系列大模型开发团队
  • 二、基于 Amazon Bedrock 的 Claude 3 体验
  • 三、Claude 3 数据实测
    • 3.1、申请模型访问权限
    • 3.2、Claude 3 回答的严谨性
    • 3.3、验证 Claude 3 较于 ChatGPT-4 数据集更新时间
    • 3.4、“二分法”判断 Claude 3 训练数据截止时间
    • 3.5、综合二分法与边界测试验证前后回答的一致性
  • 总结


前言

ChatGPT-4 的训练截止日期是 2021 年 9 月,那 Claude 3 呢?在 2024 年 3 月 5 日,Anthropic 在官网正式悄然发布了新一代 Claude 大模型——Claude 3 系列多模态大模型。在 Claude 3 正式发布后不久,亚马逊云科技 UserGroup 社区也迅速开放了基于 Amazon BedRock 的 Claude 3 体验。趁着这一次机会,正好对 Claude 3 进行一次简单的尝试。

在这里插入图片描述


声明:本文由作者“白鹿第一帅”于 CSDN 社区原创首发,未经作者本人授权,禁止转载!爬虫、复制至第三方平台属于严重违法行为,侵权必究。亲爱的读者,如果你在第三方平台看到本声明,说明本文内容已被窃取,内容可能残缺不全,强烈建议您移步“白鹿第一帅” CSDN 博客查看原文,并在 CSDN 平台私信联系作者对该第三方违规平台举报反馈,感谢您对于原创和知识产权保护做出的贡献!

文章作者:白鹿第一帅,作者主页:https://blog.csdn.net/qq_22695001,未经授权,严禁转载,侵权必究!

说明:本文素材及部分内容由亚马逊云科技 UserGroup 成都社区讲师——刘文溢授权,亚马逊云科技 User Group Leader,CSDN 成都城市开发者社区、数据库技术专区主理人——郭靖友情代为编辑发表。

一、Claude 3 系列大模型开发团队

Anthropic 成立于 2020 年,其创始人 Dario Amodei 和 Daniela Amodei 均来自 OpenAI。由于对 OpenAI 在技术尚未完全成熟时就急于商业化的做法表示不满,他们毅然离职创立了 Anthropic,旨在构建更安全、可解释、可操控的 AI 系统。

在这里插入图片描述
本次发布的 Claude 3 系列也在设计上体现了 Anthropic 对安全性和易用性的高度重视。开发团队特别强调了模型安全性,通过多团队合作,着手降低虚假信息、生物安全滥用、选举干预等潜在风险。同时,增强了模型透明度并减少隐私问题,确保了使用过程中的安全与信任。

二、基于 Amazon Bedrock 的 Claude 3 体验

在 Claude 3 正式发布后不久,亚马逊云科技 UserGroup 社区也迅速开放了基于 Amazon BedRock 的 Claude 3 体验。趁着这一次机会,正好对 Claude 3 进行一次简单的尝试。

在这里插入图片描述
BedRock 是亚马逊云科技提供 AI 生成图像和文本的云服务。针对 Claude 3,BedRock 在随机性和多样性上提供一部分可调节的能力。

  • 温度——指的是调整生成的随机程度。较低的温度意味着较少的随机生成。
  • 排名前 P——如果设置为小于1的浮点数,则仅保留概率总计为Top_p或更高的最小一组可能的令牌进行生成。
  • 排名前 K——可用于减少生成令牌的重复性。该值越高,对先前存在的令牌施加惩罚就越严厉,这与它们在提示或之前的生成中已经出现的概率成正比。

三、Claude 3 数据实测

3.1、申请模型访问权限

下图是亚马逊云科技 Bedrock 的页面,在申请了模型的访问权限后,就可以在聊天操场开始尝试了。

在这里插入图片描述

3.2、Claude 3 回答的严谨性

不出所料的是,Claude 3 在回答的严谨性上保持了一贯的严谨,很抱歉、非常抱歉、十分抱歉……

在这里插入图片描述

3.3、验证 Claude 3 较于 ChatGPT-4 数据集更新时间

ChatGPT-4 的训练截止日期是 2021 年 9 月,ChatGPT 大模型不同版本、描述信息及训练日期,具体如下图所示:

在这里插入图片描述
既然 Claude 3 发布时间晚于 ChatGPT-4,那他所采用数据集会不会比 ChatGPT 更新呢?
答案不出所料:非常抱歉……

在这里插入图片描述

3.4、“二分法”判断 Claude 3 训练数据截止时间

在这里插入图片描述
对于任何一个基于大规模数据训练的人工智能系统来说,它的知识面就等同于截止到训练数据集的时间范围。超出这一时间范围,模型就可能无法给出可靠回答。因此,判断出它的训练数据截止时间,等于解开了 AI 能力的谜团。 那么,在 Claude 3 已经明确拒绝的情况下,该如何探测 Claude 3 的训练数据截止时间呢?

我们可以借助二分法的思路,通过一种"问答游戏"的方式加以求证。

二分法,简单来说,是一种处理问题的策略,尤其在需要查找或解决问题时特别有用。它通常从问题的中间部分开始,然后根据这个中间部分的情况,将问题分为两部分来考虑。比如,在一个有序数组中查找一个特定的数字,你可以先看数组中间的数字。如果这个数字正好是你要找的,那就找到了;如果不是,你要找的数字比中间数字小,那就在数组的前半部分继续找;如果比中间数字大,那就在后半部分找。这样每次都能排除掉一部分不需要考虑的内容,直到找到答案或确定答案不存在。

在这里插入图片描述
首先,我们需要设定一个较大的时间范围,比如从 2022 年 1 月 1 日到 2023 年 3 月 1 日。接下来,选择该范围的中点日期,比如2022年6月15日,询问一些该日期前后发生的重大事件。如果 Claude 3 能够正确回答这些事件,那说明截止时间至少在该中点之后;反之,则在之前。以此为基准,我们就可以将时间范围二分,重复上述过程,持续缩小范围。经过若干轮次的缩减,我们最终就能够将 Claude 3 的训练数据截止时间锁定在一个较小的时间段内,精度可以做到日级别。

3.5、综合二分法与边界测试验证前后回答的一致性

在实际的测试过程中,为了验证前后回答的一致性,我们综合了二分法和边界测试

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


文章作者:白鹿第一帅,作者主页:https://blog.csdn.net/qq_22695001,未经授权,严禁转载,侵权必究!


总结

根据 Claude 3 的回答,我们可以简单得出这样的结论:Claude 3 的训练数据截止日期是 2022 年 12 月 31 日,它在接受训练时能够吸收包含 2021 年 9 月至 2022 年 12 月之间的最新数据和知识。而 ChatGPT-4 在训练过程中没有接触到 2021 年 9 月之后产生的新数据、事件、趋势和技术进展等信息。

在这里插入图片描述


我是白鹿,一个不懈奋斗的程序猿。望本文能对你有所裨益,欢迎大家的一键三连!若有其他问题、建议或者补充可以留言在文章下方,感谢大家的支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/488597.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

瑞吉外卖实战学习--登录过滤器和判断是否登录过

完善登录功能 1、创建自定义过滤器LoginCheckFiler1.1通过WebFilter创建过滤器1.2 验证是否可以拦截请求1.3 代码 2、在启动类加入注解ServletComponentScan 用来扫描过滤器触发所有的过滤器ServletComponentScan 3、完善过滤器的处理逻辑3.1判断是否需要是要放行的请求3.2判断…

斌之曲科技集团迎接绵阳科技城新区领导考察,共探数字新能源

2024年3月22日上午,一场旨在促进科技与经济发展深度融合的考察活动在上海斌之曲科技集团总部隆重举行。绵阳科技城新区经济合作局局长陈桂全一行到访,集团董事长田斌先生、总裁廖彬曲女士热情接待,双方就科技创新、市场布局等议题进行了深入探…

js逆向入门之简概实例--MD5

目录 js逆向入门之简概&实例--MD5 爬虫: 爬虫流程: 逆向js原因: 网站反爬: 什么是MD5? js加密特征: 练习开始 正常请求 加post请求 伪装加U-Sign参数 伪装加Content-Type参数 请求参数变字符串 代码实现: 真逆开始 补充知识点: 代码 免责声明…

【数据结构刷题专题】—— 二叉树

二叉树 二叉树刷题框架 二叉树的定义: struct TreeNode {int val;TreeNode* left;TreeNode* right;TreeNode(int x) : val(x), left(NULL), right(NULL); };1 二叉树的遍历方式 【1】前序遍历 class Solution { public:void traversal(TreeNode* node, vector&…

[C#]winformYOLO区域检测任意形状区域绘制射线算法实现

【简单介绍】 Winform OpenCVSharp YOLO区域检测与任意形状区域射线绘制算法实现 在现代安全监控系统中,区域检测是一项至关重要的功能。通过使用Winform结合OpenCVSharp库,并结合YOLO(You Only Look Once)算法,我们…

Maven高级(工程分模块开发,聚合于继承,版本锁定,Mavne私服的搭建和发布)【详解】

目录 一、Maven复习 1. Maven基本概念 1 Maven的作用 2 Maven的仓库 3 坐标的概念 2. Maven安装配置 3. Maven构建项目 4. Maven依赖管理 5. Maven依赖传递 二、工程分模块开发 1. 分模块开发介绍 2. 工程分模块示例 (1) 创建父工程 (2) 创建pojo模块步骤 (3) 创…

YOLOv8改进 | 检测头篇 | 2024最新HyCTAS模型提出SAttention(自研轻量化检测头 -> 适用分割、Pose、目标检测)

一、本文介绍 本文给大家带来的改进机制是由全新SOTA分割模型(Real-Time Image Segmentation via Hybrid Convolutional-TransformerArchitecture Search)HyCTAS提出的一种SelfAttention注意力机制,论文中叫该机制应用于检测头当中(论文中的分割效果展现目前是最好的)。我…

如何学习VBA_3.2.19:利用Shell函数运行可执行程序

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的劳动效率,而且可以提高数据处理的准确度。我推出的VBA系列教程共九套和一部VBA汉英手册,现在已经全部完成,希望大家利用、学习。 如果…

Java-Java基础学习(4)-多线程(2)

3.7. Lambda表达式 为什么要使用lambda表达式 避免匿名内部类定义过多;可以让代码看起来更简洁;去掉一堆没有意义的代码,只留下核心逻辑 属于函数式编程的概念,格式 (params) -> expression [表达式](params) -> statement…

【教学类-44-11】20240324 杨任东竹石体 Regular(实线字体)制作的数字描字帖(AI对话大师缩略版)

作品展示 背景需求: 之前有三款阿拉伯数字字体,但是与《幼儿用数字描字簿》字体有差异 【教学类-44-05】20240201 德彪钢笔行书(实线字体)制作的数字描字帖-CSDN博客文章浏览阅读396次,点赞6次,收藏5次。【…

Python之Web开发中级教程----中级教程成果下载

Python之Web开发中级教程----中级教程成果下载 到目前为止,中级教程已经完成。 按照一步步的教程搭建虚拟机中的环境,包括内容如下: Ubuntu操作系统搭建 Python 配置 Redis 安装配置 Python库中包括 Pip安装 Pyinstaller安装 Redis安装 Jie…

strlen和sizeof

定义 strlen 和 sizeof 是 C 语言中两个用于确定字符串或数据类型大小的常用操作符&#xff0c;但它们的工作方式和目的有所不同。下面是对这两个操作符的详细解释&#xff1a; strlen strlen 是一个库函数&#xff0c;定义在 <string.h> 头文件中。它用于计算以空字符…

拥有超小型领先工艺射频微波电子元器件厂商兆讯授权世强硬创代理

射频前端芯片在模拟芯片中&#xff0c;属于进入门槛较高、设计难度较大的细分领域&#xff0c;由于国内射频前端芯片行业起步较晚&#xff0c;其市场份额主要被外企所占据&#xff0c;而在国产化浪潮的推动下&#xff0c;上游厂商的射频前端产品及技术逐渐具备领先的竞争优势。…

深度学习(三)vscode加jupyter notebook插件使用

0.前言 哎呀&#xff0c;我本次的实验是在新电脑上使用的&#xff0c;之前的笔记本上的环境什么的我都是很久以前弄好了的&#xff0c;结果到了新电脑上我直接忘了是该怎么配的了&#xff0c;不过万幸&#xff0c;花了点时间&#xff0c;查查补补&#xff0c;现在总算是可以了。…

论文汇总:A Closer Look at Few-shot Classification Again

文章汇总 文章是在总体上再一次地观察如何小样本领域存在的问题&#xff0c;并且发现了较为有趣的规律 1.测试误差随训练类别的数量而下降&#xff0c;而不是随每个类别的训练样本数量而下降。 2.训练算法(me&#xff1a;预训练模型)和自适应算法(me&#xff1a;预训练之后的…

参展企业和专业观众均创历届新高“2024杭州国际安防展会”

随着社会的不断发展&#xff0c;安防行业逐渐成为一个备受关注的领域。杭州作为中国的科技创新之城&#xff0c;一直以来都是安防行业的重要聚集地。本次展会的举办&#xff0c;不仅为参展企业提供了一个展示自身实力的平台&#xff0c;也为观众提供了一个了解安防行业最新技术…

深度解析JVM世界:JVM内存分配

本篇文章的主要内容是介绍JVM内存的分配方式、JVM内存的快速分配策略、JVM的逃逸分析和堆内存的分代思想几部分内容。 请同学们认真听讲&#xff0c;面试会问到。。。 1. 内存分配 大家需要注意不分配内存的对象无法进行其他操作 JVM 为对象分配内存的过程&#xff1a;首先…

[flask]http请求//获取请求体数据

import jsonfrom flask import Flask, requestapp Flask(__name__)app.route("/form1", methods["post"]) def form1():"""获取客户端请求的请求体[表单]:return:""""""获取表单数据请求url&#xff1a;&qu…

[深度学习]yolov8+streamlit搭建精美界面GUI网页设计源码实现三

【设计思路介绍】 为了使用YOLOv8和Streamlit搭建一个精美的界面GUI网页&#xff0c;你需要遵循几个关键步骤。以下是一个简化的流程&#xff0c;帮助你设计并实现这一目标&#xff1a; 1. 环境准备 安装YOLOv8 YOLOv8是一个先进的实时目标检测模型。你需要先下载并安装YOL…

Android Studio 代理

Android Studio的代理&#xff0c;分为两级代理&#xff1a; 1. Android Studio本身的代理&#xff0c;路径在&#xff0c;右上角&#xff0c;File->Settings->Appearance & Behavior -> System Settings -> Http Proxy&#xff0c;如图所示&#xff1a; 2. G…
最新文章