每周AI新闻(2024年第11周)Meta公布Llama 3集群细节 | Sora将于年内推出 | 全球首个AI软件工程师发布

这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。

每周日解读每周AI大事件。

欢迎关注同名公众号【陌北有棵树】,关注AI最新技术与资讯。

大厂动向

Meta公布Llama 3训练集群细节

Meta宣布推出两个24576-GPU数据中心规模集群,将其称作“Meta对AI未来的重大投资”,并公布其GenAI基础设施细节,涉及硬件、网络、存储、设计、性能和软件的详细信息。Meta使用这种集群设计进行Llama 3训练。到2024年底,Meta的目标是继续扩大基础设施建设,包括35万块英伟达H100 GPU,作为其产品组合的一部分,将具有相当于近60万块H100的计算能力。

Meta每天处理数百万亿个AI模型执行,因此基于Arista 7800以及Wedge400和Minipack2 OCP机架交换机构建了一个具有融合以太网远程直接内存访问(RDMA)(RoCE)网络结构解决方案的集群。另一个集群采用英伟达Quantum2 InfiniBand结构。这两种方案都互连400 Gbps端点,都是用Meta内部设计的开放GPU硬件平台Grand Teton构建的。Meta还结合英伟达NCCL更改优化了网络路由策略,以实现最佳的网络利用率。

谷歌发布通用游戏AI智能体

谷歌DeepMind团队发布了可扩展、可指导的多世界智能体SIMA(Scalable Instructable Multiworld Agent),该智能体可以遵循自然语言指令在各种视频游戏环境中执行任务,从个别游戏转向通用的、可指导的游戏AI智能体。据介绍,SIMA适用于3D虚拟环境,可通过语言接口将先进的AI模型能力转化为有用的现实世界行动。

Sora将于年内推出 拟增加语音功能

据《华尔街日报》报道,OpenAI CTO米拉·穆拉蒂(Mira Murati)在采访中透露,文生视频工具Sora将在今年内发布,未来计划增加语音功能。她称,时长20秒、分辨率720P的视频仅需几分钟就能生成。

ChatGPT每日耗电量是普通家庭的1.7万倍

据《纽约时报》报道,聊天机器人ChatGPT每天需要处理超过2亿次请求,其电量消耗可能高达每天50万千瓦时。相比之下,美国普通家庭每天的平均用电量仅为29千瓦时,这意味着ChatGPT的日耗电量是普通家庭的1.7万倍以上。

苹果多模态大模型研究进展公布

根据arXiv,苹果研究人员公布了最新多模态大模型研究成果MM1,这一系列模型参数最高为30B。得益于大规模的预训练,MM1具有增强的上下文学习和多图像推理等能力,可以实现少量的思维链提示。

论文地址:https://arxiv.org/pdf/2403.09611.pdf

GPT-4.5 Turbo疑似曝光 网传可能6月发布

网友发现GPT-4.5 Turbo的信息疑似在搜索引擎上被提前泄露,Bing、DuckDuck Go等搜索引擎已对GPT-4.5 Turbo产品页面建立了索引。根据泄露信息,GPT-4.5 Turbo有256k上下文窗口,知识截止日期是2024年6月。

苹果开测AI广告产品

据Business Insider报道,苹果已经开始测试一款类似于谷歌Performance Max的AI广告产品,希望为其年收入70亿美元的广告业务提供动力。这款AI工具用于优化App Store的广告活动,能自动决定在App Store中放置广告的位置,与谷歌的Performance Max和Meta的Advantage+功能相仿。苹果已开始在一小群广告客户中测试该产品,预计将在未来几个月正式推出这款产品。

谷歌新研究:模型窃取攻击程序,获取模型关键信息

根据arXiv,谷歌于3月11日推出了首个模型窃取攻击程序,该程序从OpenAI的ChatGPT或谷歌的PaLM-2等黑盒生产语言模型中提取精确的、重要的信息。具体来说,在给定典型的API访问的情况下,研究人员的攻击恢复了Transformer模型的嵌入投影层。其攻击运行花费不到20美元,提取了OpenAI的Ada和Babbage语言模型的整个投影矩阵。由此,团队首次确认这些黑盒模型的隐藏维度分别为1024和2048。团队还恢复了GPT-3.5-turbo 模型的精确隐藏维度大小,并估计恢复整个投影矩阵的查询成本低于2000美元。

论文地址:https://arxiv.org/pdf/2403.06634

OpenAI开源Transformer结构分析工具

根据社交媒体X,OpenAI超级对齐团队联合负责人Jan Leike宣布,OpenAI开放了自己内部一直用于分析Transformer内部结构的工具。该工具结合了自动可解释性和稀疏自动编码器,允许开发者快速探索模型而无需编写代码。

GitHub地址:https://github.com/openai/transformer-debugger

创业 & 投融资

Physical Intelligence获OpenAI投资 为机器人研发“大脑”

据彭博社报道,AI创企Physical Intelligence已融资7000万美元,投资方包括OpenAI、Thrive Capital、Sequoia Capital、Greenoaks Capital Partners、Lux Capital、Khosla Ventures等。Physical Intelligence由机器人和AI专家团队组成,计划创建可以为各类机器人和机器添加高级智能的软件,希望将用于构建语言模型的技术与自己的控制和指导机器的技术相结合,最终目标是创建一个作为一种通用机器人系统的人工智能。

AI基础设施平台Together AI完成1.06亿美元融

据路透社报道,英伟达支持的AI基础设施创企Together AI近日完成1.06亿美元融资,由Salesforce领投,Coatue Management等老股东跟投。自去年秋天以来,随着投资者纷纷支持生成式AI初创公司,其估值翻了一番,此次融资对Together AI的估值为12.5亿美元。

AI芯片创企篆芯获2亿元融资

据硬氪报道,篆芯半导体南京有限公司日前完成2亿元A2轮融资,此次融资由隆湫资本领投,睿悦投资、柠盟投资、君盛资本、卓源亚洲、华方资本等多家新老股东跟投。本轮融资资金将用于技术研发和产品升级。据悉,篆芯于2021年成立,主要业务是为AI、云计算、万物互联时代打造网络芯片,服务国内主流的网络设备提供商。篆芯即将推出第一款芯片“兰亭”,其具备高性能、可编程交换的特性,在云计算数据中心、园区网、核心骨干网等关键基础设施中均可适配。

AI Agent创企Nanonets获2900万美元融资

AI Agent创企Nanonets宣布获得2900万美元B轮融资,由Accel India领投,Elevation Capital、YCombinator等现有投资者参投。其累计融资金额达4200万美元。Nanonets的使命是为各种规模的企业解锁被困数据,把最重复、最平凡的办公室工作自动化。有了Nanonets的自主AI Agents,企业可在几乎任何数据上运行任何业务工作流。

爱诗科技获亿元级融资 原字节高管创业

爱诗科技近日已完成亿级人民币A1轮融资,由达晨财智领投,光源资本担任独家财务顾问。同时,国内版爱诗视频大模型上线内测。爱诗科技创立于2023年4月,创始人王长虎毕业于中国科学技术大学,曾历任微软亚洲研究院主管研究员、字节AI实验室技术总监、字节视觉技术负责人等职位,爱诗科技聚焦AI视频生成大模型及应用,其视频生成产品PixVerse海外版已于2023年11月上线。

产品 & 模型

全球首个AI软件工程师发布

由华人团队创办的Cognition AI宣布推出世界上首个全自主AI软件工程师Devin,据悉能在几分钟内独立完成整个软件项目。随着其在长期推理和规划方面的进步,Devin可计划和执行需要数千个决策的复杂工程任务,能够在每一步中回忆起相关的上下文,随时间推移学习并修正错误。Cognition AI团队共10人,其中8位是华人,已获得由Founders Fund领投的2100万美元A轮融资。

Claude 3 Haiku正式上线

AI大模型创企Anthropic发布了Claude 3 Haiku,这是同系列中速度最快且最实惠的型号,该模型现已与Sonnet和Opus一起在Claude API和claude.ai上为Claude Pro订阅者提供。

Midjourney测试新算法 支持生成“一致角色”

根据社交平台X,Midjourney宣布正在测试新算法,以帮助用户在图像中拥有“一致的角色”,从而让用户更好地用生成的图片讲故事,新算法对Midjourney MJ6和Midjourney Niji6版本都可用。

零一万物API上线 支持输入30万汉字

大模型创企零一万物发布了Yi大模型API(应用程序接口)开放平台。据悉,此次 API 开放平台提供以下模型:Yi-34B-Chat-0205,支持通用聊天、问答、对话、写作、翻译等功能;Yi-34B-Chat-200K,支持200K 上下文,多文档阅读理解、超长知识库构建;Yi-VL-Plus多模态模型,支持文本、视觉多模态输入,中文图表体验超过GPT-4V。

3D视觉语言动作生成世界模型发布

根据arXiv,一篇论文介绍了3D视觉-语言-动作生成世界模型3D-VLA。研究人员通过引入一系列新的具体化基础模型来提出3D-VLA,这些模型通过生成世界模型无缝链接3D感知、推理和行动。具体来说,3D-VLA 构建在基于3D的大语言模型之上,并引入了一组交互令牌来与具体环境进行交互。研究保留数据集的实验表明,3D-VLA提高了具体环境中的推理、多模态生成和规划能力。

Covariant推出机器人基础模型RFM-1

3月11日,Covariant宣布推出基于真实世界多模态机器人数据的基础模型RFM-1,以赋予机器人类似人类的推理能力。该模型能在物理世界的苛刻条件下准确地模拟和操作。它是一个多模态any-to-any序列模型,拥有80亿参数,经过文本、图像、视频、机器人动作和一系列数值传感器读数的训练。其训练数据既包括常见的互联网数据,也包括丰富的现实世界物理交互数据。RFM-1对物理的理解来自于学习生成视频,通过初始图像和机器人动作的输入标注,它作为物理世界模型来预测未来的视频标注。

如果觉得不错,随手点个赞、评论、转发吧。我是陌小北,一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章,欢迎关注。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/463646.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

第二十四天-数据可视化Matplotlib

目录 1.介绍 2.使用 1. 安装: 2.创建简单图表 3.图表类型 1.一共分为7类 2.变化 1.折线图 3.分布 ​编辑 1.直方图 2.箱型图 4.关联 1. 散点图: 2.热力图: 5.组成 1.饼图 2.条形图 6.分组 1.簇型散点图 2.分组条形图 3.分…

【ollama】linux、window系统更改模型存放位置,全网首发2024!

首先是window系统 so easy 直接进入系统环境变量添加就行 其次是linux系统 全靠自己试出来的,去Ollama官网找半天文档不知道在哪,而且linux也没有说:【 https://github.com/ollama/ollama/blob/main/docs/README.md https://github.com/ollama/ollama/blob/main/docs/li…

Ubuntu 如何安装 Beyond Compare?

Ubuntu20.04安装Beyond Compare 4.3.7 一、官网下载方式一:方法二:使用 .deb 包安装 二、安装相关依赖和bcompare三、破解常见错误解决方法 ) 文件比较工具Beyond Compare是一套由Scooter Software推出的文件比较工具。主要用途是对比两个文件夹或者文件…

HCIA——30奈奎斯特定理、香农定理

学习目标: 计算机网络 1.掌握计算机网络的基本概念、基本原理和基本方法。 2.掌握计算机网络的体系结构和典型网络协议,了解典型网络设备的组成和特点,理解典型网络设备的工作原理。 3.能够运用计算机网络的基本概念、基本原理和基本方法进行…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:TextTimer)

通过文本显示计时信息并控制其计时器状态的组件。 说明: 该组件从API Version 8开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 子组件 无 接口 TextTimer(options?: TextTimerOptions) 参数: 参数名参数类型…

Kotlin进阶之协程从入门到放弃

公众号「稀有猿诉」 原文链接 Kotlin进阶之协程从入门到放弃 协程Coroutine是最新式的并发编程范式,它是纯编程语言层面的东西,不受制于操作系统,轻量级,易于控制,结构严谨,不易出错,易于…

深入浅出理解 AI 生图模型

目录 引言 一、Stable Diffusion原理 首先 随后 最后 二、DDPM模型 1 资料 2 原理 扩散过程 反向过程 3 公式结论 三、优缺点 优点: 缺点: 四、改进与完事 LDM代表作 原理概括 Latent Space(潜空间) 五、总结 引…

提高安全投资回报:威胁建模和OPEN FAIR™风险分析

对大多数人和企业来说,安全意味着一种成本。但重要的是如何获得适合的量,而不是越多越好。然而,你如何决定什么时候可以有足够的安全性,以及你如何获得它?则完全是另一回事。 该篇文章是由The Open Group安全论坛主办&…

【PyTorch】进阶学习:一文详细介绍 load_state_dict() 的应用场景、实战代码示例

【PyTorch】进阶学习:一文详细介绍 load_state_dict() 的应用场景、实战代码示例 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入…

vb.net+zxing.net随机彩色二维码、条形码

需要zxing库支持ZXing.NET Generate QR Code & Barcode in C# Alternatives | IronBarcode 效果图: 思路:先生成1个单位的二维码,然后再通过像素填充颜色,颜色数组要通过洗牌算法 洗牌算法 Dim shuffledCards As New List(…

C#控制台贪吃蛇

Console.Write("");// 第一次生成食物位置 // 随机生成一个食物的位置 // 食物生成完成后判断食物生成的位置与现在的蛇的身体或者障碍物有冲突 // 食物的位置与蛇的身体或者障碍物冲突了,那么一直重新生成食物,直到生成不冲突…

GenAI开源公司汇总

主要分类如下: 1. 基础模型:这些是机器学习和AI的核心模型提供商,它们提供基础的算法和技术支持。 2. 模型部署与推断:提供云服务和计算资源,帮助用户部署和运行AI模型。 3. 开发者工具:支持AI/ML的开发…

【网络原理】TCP 协议中比较重要的一些特性(三)

目录 1、拥塞控制 2、延时应答 3、捎带应答 4、面向字节流 5、异常情况处理 5.1、其中一方出现了进程崩溃 5.2、其中一方出现关机(正常流程的关机) 5.3、其中一方出现断电(直接拔电源,也是关机,更突然的关机&am…

拜占庭将军问题相关问题

1、拜占庭将军问题基本描述 问题 当我们讨论区块链共识时,为什么会讨论拜占庭将军问题? 区块链网络的本质是一个分布式系统,在存在恶意节点的情况下,希望 整个系统当中的善良节点能够对于重要的信息达成一致,这个机…

Python语言基础与应用-北京大学-陈斌-P40-39-基本扩展模块/上机练习:计时和文件处理-给算法计时-上机代码

Python语言基础与应用-北京大学-陈斌-P40-39-基本扩展模块/上机练习:计时和文件处理-给算法计时-上机代码 上机代码: # 基本扩展模块训练 给算法计时 def factorial(number): # 自定义一个计算阶乘的函数i 1result 1 # 变量 result 用来存储每个数的阶…

第十三篇:复习Java面向对象

文章目录 一、面向对象的概念二、类和对象1. 如何定义/使用类2. 定义类的补充注意事项 三、面向对象三大特征1. 封装2. 继承2.1 例子2.2 继承类型2.3 继承的特性2.4 继承中的关键字2.4.1 extend2.4.2 implements2.4.3 super/this2.4.4 final 3. 多态4. 抽象类4.1 抽象类4.2 抽象…

微信小程序关闭首页广告

由于之前微信小程序默认开启了首页广告位。导致很多老人误入广告页的内容,所以想着怎么屏蔽广告。好家伙,搜索一圈,要么是用户版本的屏蔽广告,或者是以下一个模棱两可的答案,要开发者设置一下什么参数的,如…

ZK vs FHE

1. 引言 近期ZAMA获得7300万美金的投资,使得FHE获得更多关注。FHE仍处于萌芽阶段,是未来隐私游戏规则的改变者。FHE需与ZK和MPC一起结合,以发挥最大效用。如: Threshold FHE:将FHE与MPC结合,实现信任最小…

Kafka MQ 生产者

Kafka MQ 生产者 生产者概览 尽管生产者 API 使用起来很简单,但消息的发送过程还是有点复杂的。图 3-1 展示了向 Kafka 发送消息的主要步骤。 我们从创建一个 ProducerRecord 对象开始,ProducerRecord 对象需要包含目标主题和要发送的内容。我们还可以…

Python基础(七)之数值类型集合

Python基础(七)之数值类型集合 1、简介 集合,英文set。 集合(set)是由一个或多个元素组成,是一个无序且不可重复的序列。 集合(set)只存储不可变的数据类型,如Number、…