试用Claude3

1 简介

好消息是,2024 年 3 月 4 日发布了 Claude3,据传比 GPT-4 更好,snooet 版本可以免费试用,坏消息是我们这儿不能用。

在官网注册时,需要选择国家并使用手机接收短信验证码。而在选项中没有中国这个选项。即使成功注册了账号并申请了 API 密钥,免费版本仍需要绑定信用卡才能使用。绑定信用卡也需要接收短信验证,网上说每个手机号只能注册一次,所以似乎也无法短信接收平台。(如果你找到了注册方法,请私信告诉我)

虽然无法通过 API 调用并将其添加到我们的工具中,但可以通过亚马逊云来免费体验一下。

2 Claude3

2.1 三个模型

Claude 3 共发布了三个模型:

  • Claude 3 Opus:最强大的模型,在高度复杂的任务上提供最先进的性能,并展示流畅性和类似人类的理解。
  • Claude 3 Sonnet:在智能和速度之间最平衡的模型,是企业工作负载和规模化 AI 部署的绝佳选择
  • Claude 3 Haiku:最快、最紧凑的模型,旨在实现近乎即时的响应能力和模仿人类交互的无缝 AI 体验

2.2 主要特点

这次升级的主要特点包含:

  • 多语言功能:Claude 3 提高了非英语语言的流利度,支持翻译服务和全球内容创建等用例。
  • 视觉和图像处理:所有 Claude 3 模型都可以处理和分析视觉输入、从文档中提取内容、处理 Web UI、生成图像元数据等。
  • 可操纵性和易用性:Claude 3 更擅长遵循提示。
  • 内容更新:Claude 3 系列将定期接收更新,以增强性能、扩展功能并解决任何已发现的问题。

2.3 价格

|400

|400

Claude 3 OpusClaude 3 SonnetClaude 3 HaikuClaude 2.1Claude 2Claude Instant 1.2
Cost (Input / Output per MTok^)15.00/75.003.00/15.000.25/1.258.00/24.08.00/24.00.80/2.40
Training data cut-offAug 2023Aug 2023Aug 2023Early 2023Early 2023Early 2023

2.4 资料

主页:https://www.anthropic.com/

文档:https://docs.anthropic.com/claude/docs/models-overview

3 使用方法

3.1 界面调用

Anthropic 的 Claude 3 Sonnet 模型在亚马逊 Bedrock 平台上可以免费试用,扫码登录:

https://portal.cloudassist-beta.sign-up.china.aws.a2z.com/demo/qrcode?trk=community

(顺便提一句:亚马逊的云实验环境实在很好用)

进入后,依次操作:

  • 点击:" 限时试用 "
  • 点击:尝试 RedRock" 入门 "
  • 点击:右侧 ANTHROPIC " 请求模型访问权限 "
  • 点击:右上 " 管理模型访问权限 "
  • 点击:ANITHROPIC 右侧“”提交应用场景详细信息”如下,填好后稍等刷新,可以看到成功获取到访问权限。

|300

|300

  • 点击:左侧聊天,把模型切换成 Claude3 sonnet 即可开始聊天

3.2 python 程序调用

用法非常简单,和 gemini,openai gpt 差不多,就不在此 demo 了。

4 测试

4.1 编写代码

  • 提问:给我写一段 android 音乐播放器的界面代码。
  • 回答:返回 layout xml 看着还行,没有 java 代码,还包含一些注意事项。
  • 讨论:如果细化一下需求,大问题拆成小问题再问,效果应该还不错。

4.2 知识性问题

  • 提问:请介绍一下莫言。
  • 回答:回答正确。
  • 讨论:还提问了另一些知识性问题,感觉知识性内容 Claude3 和 Genimi 比 GPT-4 明显更好。

4.3 翻译问题

  • 提问:将葳文翻译成中文:ང་རང་གིས་གཙོ་སྒྲུབ་བྱས་པའི་དབང་སྡུད་གསོལ་འདེབས་ཀྱི་ཚོམ་འདིར་ཕེབས་པར་དགའ་བསུ་ཞུ། ཁོམ་སྐབས་དང་བསྟུན་ནས་དབང་སྡུད་གསོལ་འདེབས་ཉུང་ཙམ་གསུང་རོགས་ཞ
  • 回答:基本正确,沟通方式很友好,可能由于使用大量人工标注 instruct 引导学习。
  • 分析:后来又翻译了一段颂词,藏文相对小语种,我觉得相比之下,Claude 和 Gemini 差不多,gpt4 略差一点,gpt3.5 几乎没法用。

4.4 阅读理解

  • 提问:请从原文中提取合同核心条款:“回购权”," 股权锁定 "," 优先认购权 ",....,对应的数据块,用原文回答。原文如下:……(上下文支持足够长,可以在聊天中加原文)
  • 回答:Claude3 答出了核心条款所在章节,但并没有用原文回答,试了几种问法,均没有用原文回答,可能是模型对输出量做了限制。如果问单个条款,在答案不太长的情况下,可用原文回答。
  • 提问:从原文找:" 股权锁定 " 对应的数据块,用原文回答。
  • 回答:返回了我想要的完整数据块,及一些总结性文本,总结得比我理解得还好呢。
  • 反馈时间:上传 2W 字,反馈时间 20-30 秒。
  • 讨论:提问内容属于相对专业领域,模型能理解:反摊薄条款=反稀释,优先清算权=优先分配权,以及正文内容与标题的关系,可见 Claude3 理解能力确实强;但没有完全按要求回答,偶尔会产生一些幻觉。相对 GPT3.5/4 好很多。
  • 分析:在这个应用场景里,推荐用规则提取能提取的内容,用模型处理比较复杂的内容,以平衡性价。



4.5 总结

个人体会,不一定对。

  • 我感觉 Gemini,Claude3,GPT-4 基本是一个层次的,效果比 GPT-3.5 好很多。
  • 未来可能不会再有一大独大的情况了。
  • 模型对比:
    • GPT-4 各方面比较均衡,生态完善,工具链太熟悉,切换也有成本。
    • Gemini 知识能力比较强,更深入专业领域,小伙伴拿他当百度百科用。
    • Claude 理解能力比较好,更深入专业领域,目前没法在程序中调用。
  • 最终选型还是要看价格,充值难度,易得性,响应时间,效果,取平衡。
  • 几个模型对单一问题的回答都还不错,但对于复杂问题可能还需要加思维链和 RAG 来做。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/438192.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Maven】Maven 基础教程(五): jar 包冲突问题

《Maven 基础教程》系列,包含以下 5 篇文章: Maven 基础教程(一):基础介绍、开发环境配置Maven 基础教程(二):Maven 的使用Maven 基础教程(三):b…

贪心 Leetcode 763 划分字母区间

划分字母区间 Leetcode 763 学习记录自代码随想录 给你一个字符串 s 。我们要把这个字符串划分为尽可能多的片段,同一字母最多出现在一个片段中。 注意,划分结果需要满足:将所有划分结果按顺序连接,得到的字符串仍然是 s 。 返…

JAVA语言基础 JAVA入门

注释 单行注释:用双斜线 // 表示 多行注释:用 /*------------------*/ 表示 文档注释:用 /**-----------------*/ 表示 分隔符 常见的分隔符有:分号 ; 花括号 {} 方括号 [ ] 圆括号 () 空格 圆点 . 在 Java 语言中每一条…

LeetCode 刷题 [C++] 第300题.最长递增子序列

题目描述 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列。 题目…

快递包装展|2024上海国际电商物流包装产业展览会

2024中国(上海)国际电商物流包装产业展览会 2024 China (Shanghai) international e-commerce logistics packaging industry exhibition 时 间:2024年7月24日 —7月26日 地 点:国家会展中心(上海市青浦区崧泽大道333号&#xff…

react 分步表单中使用useEffect来更新表单值的问题

问题背景:我在完成一个分步表单的功能的时候,在进行点击下一步的时候,会通过useEffect 来监听下一步或者上一步的动作,进行表单赋值,我使用 useEffect(() > {setFieldsValue(formValues);}, [stepNum]) 直接赋值的…

2024-3-7 市场分歧视角

昨天安奈儿市场带领市场情绪一致,新型工业化方向独占鳌头,日内高潮节点尾盘老龙 克来机电涨停,昨晚很多老师在YY老龙是不是要二波了,呵呵。 今天市场分歧从竞价就开始了,隔夜单我记忆中 天奇股份88亿,上海…

MySQL--优化(索引--索引创建原则)

MySQL–优化(索引–索引创建原则) 定位慢查询SQL执行计划索引 存储引擎索引底层数据结构聚簇和非聚簇索引索引创建原则索引失效场景 SQL优化经验 一、索引创建原则 我们使用的索引种类: 主键索引唯一索引根据业务创建的索引(复…

线程安全——使用线程安全函数,多线程中执行fork引发的问题及如何解决

目录 一、引例 二、线程安全 三、多线程中执行fork 3.1 多线程中某个线程调用 fork()&#xff0c;子进程会有和父进程相同数量的线程吗? 3.2 父进程被加锁的互斥锁 fork 后在子进程中是否已经加锁 一、引例 在主线程和函数线程中进行语句分割并输出。 #include <stdi…

CRichEditUI中文乱码问题(Duilib)

这是遇到问题的时候&#xff0c;我还以为是韩文 解决方案&#xff1a; //HMODULE hmod LoadLibrary(_T("msftedit.dll"));HMODULE hmod LoadLibrary(_T("riched20.dll"));//修改一下使用的动态库&#xff0c;兼容性问题需要自己测

每日OJ题_链表②_力扣24. 两两交换链表中的节点

目录 力扣24. 两两交换链表中的节点 解析代码 力扣24. 两两交换链表中的节点 24. 两两交换链表中的节点 难度 中等 给你一个链表&#xff0c;两两交换其中相邻的节点&#xff0c;并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题&#xff08;即&…

JavaWeb04-Request,Response

目录 一、Request&#xff08;请求&#xff09; 1.作用 2.继承体系 3.获取请求数据 &#xff08;1&#xff09;请求行 &#xff08;2&#xff09;请求头 &#xff08;3&#xff09;请求体&#xff08;POST&#xff09; &#xff08;5&#xff09;Request通用方式获取请求…

植物神经紊乱的五大信号,你知道吗?

植物神经紊乱&#xff0c;听起来像是医学名词&#xff0c;但其实它离我们的生活并不遥远。它就像一位隐形的朋友&#xff0c;时常悄悄地出现&#xff0c;给我们带来从头到脚的不适&#xff0c;让我们的生活变得困扰不已。今天&#xff0c;就让我们一起揭开这位“朋友”的真面目…

[Unity实战]使用NavMeshAgent做玩家移动

其实除了Character Controller, Rigidbody&#xff0c;我们还可以使用NavMeshAgent去做。这么做的好处是能避免玩家去莫名其妙的地方&#xff08;毕竟基于烘焙过的导航网格&#xff09;&#xff0c;一般常见于元宇宙应用和mmo。 根据Unity手册&#xff0c;NavMeshAgent 也有和…

【JavaEE初阶 -- 计算机核心工作机制】

这里写目录标题 1.冯诺依曼体系2.CPU是怎么构成的3.指令表4.CPU执行代码的方式5.CPU小结&#xff1a;6.编程语言和操作系统7. 进程/任务&#xff08;Process/Task&#xff09;8.进程在系统中是如何管理的9. CPU分配 -- 进程调度10.内存分配 -- 内存管理11.进程间通信 1.冯诺依曼…

QPaint绘制自定义仪表盘组件04

网上视频抄的&#xff0c;用来自己看一下&#xff0c;看完就删掉 最终效果 ui widgetspeed.h #ifndef WIDGETSPEED_H #define WIDGETSPEED_H#include <QWidget> #include <QPaintEvent> #include <QPainter> #include <QDebug> #include <QFont&g…

时光机关:探秘Java中的Timer和TimerTask

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 时光机关&#xff1a;探秘Java中的Timer和TimerTask 前言Timer和TimerTask的基本概念Timer&#xff1a;TimerTask&#xff1a;为何它们是 Java 中任务调度的得力工具&#xff1a; Timer的使用方法创建…

【物联网应用案例】从0到N,智慧农业的数据价值

智慧农业全方位渗透到农业的每一个环节&#xff0c;云端解决方案更推动了研究人员、农艺师及农民间的密切协作&#xff0c;为研发企业提供了既经济又具扩展性的完美方案。 据IDC预计&#xff0c;到2036年&#xff0c;农场收集的数据量将增加800%以上&#xff0c;这凸显了农业数…

一款非常适合老中医用的《书剑中医电子处方软件简明版》

上了年纪的老中医&#xff0c;虽然经验丰富&#xff0c;但是电脑的基础都比较差&#xff0c;而开处方的软件通常又设计的太复杂&#xff0c;想用电脑开处方就非常困难&#xff0c;所以只好坚持手写开处方。最近&#xff0c;小编找到了一款非常简单的《书剑中医电子处方软件简明…

GPQA数据集分享

来源: AINLPer公众号&#xff08;每日干货分享&#xff01;&#xff01;&#xff09; 编辑: ShuYini 校稿: ShuYini 时间: 2024-2-28 尽管AI系统在许多任务上表现出色&#xff0c;但在需要大量专业知识和推理能力的任务上仍然存在局限性。为此&#xff0c;纽约大学的研究者提出…
最新文章