[每日AI·0501]GitHub 版 Devin,Transformer的强力挑战者 Mamba,Sora 制作细节与踩坑,OpenAI 记忆功能

AI 资讯

  • 国资委:加快人工智能等新技术与制造全过程、全要素深度融合
  • GitHub版 Devin 上线,会打字就能开发应用,微软 CEO:重新定义 IDE
  • 在12个视频理解任务中,Mamba 先打败了 Transformer
  • Sora 会颠覆电影制作吗?3 人团队使用 Sora 制作短片完整技术细节&踩坑分享
  • 小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
  • OpenAI:记忆功能现已对所有ChatGPT Plus用户开放
  • Phi-3 notebook发布,Phi的调优速度提高了2倍,且VRAM使用减少了50%
  • 使用张量并行技术进行自动驾驶感知模型训练
  • Meta 宣布在旧金山举办首届 Llama 3 黑客马拉松,与 Cerebral Valley 和 SHACK15sf 合作,提供超过1 0K 美元的现金奖励和合作伙伴积分以启动 AI 项目。这一事件强调了 Meta 在促进 AI 社区创新方面的承诺。
  • Google 推出了 Transformer 2 模型,该模型将注意力、递归、检索和前馈网络(FFN)集成到单一模块中,与原始 Transformer 的性能相当,但计算效率提高了 20 倍,并能有效处理高达 100M 上下文长度。

国资委:加快人工智能等新技术与制造全过程、全要素深度融合

报道地址
在这里插入图片描述

GitHub版 Devin 上线,会打字就能开发应用,微软CEO:重新定义 IDE

博客地址

微软的“GitHub 版 Devin” - Copilot WorkSpace,终于上线了!WorkSpace是一种“Copilot 原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。也就是说,只要有想法,而且会打字,就可以搞软件开发了。

在12个视频理解任务中,Mamba 先打败了 Transformer

论文链接 GitHub地址

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自南京大学、上海人工智能实验室、复旦大学、浙江大学的研究团队发布了一项开创性工作。他们全面审视了 Mamba 在视频建模中的多重角色,提出了针对 14 种模型/模块的 Video Mamba Suite,在 12 项视频理解任务中对其进行了深入评估。

结果令人振奋:Mamba 在视频专用和视频 - 语言任务中均展现出强劲的潜力,实现了效率与性能的理想平衡。这不仅是技术上的飞跃,更是对未来视频理解研究的有力推动。

Sora 会颠覆电影制作吗?3人团队使用 Sora 制作短片完整技术细节&踩坑分享

原文地址

今年2月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。

最近,被誉为「朋克摇滚皮克斯」的加拿大多媒体制作公司 Shy Kids 发布了一段借助 Sora 制作的视频短片《Air Head》,在社交媒体上迅速引起广泛关注。本周,知名视觉特效总监 Mike Seymour 采访了 Patrick Cederberg,就《Air Head》制作过程、技术难点等信息展开了提问,并在 fxguide 上发布一篇文章介绍了 Sora 在视频实际制作过程中发挥的作用和存在的问题。

小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

原文地址

语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场。语言如何塑造我们的社会行为?我们的社会结构又是如何在不断的言语交流中演变的?近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的模拟平台,对这些问题进行了深入探讨。

OpenAI:记忆功能现已对所有 ChatGPT Plus 用户开放

推特地址

记忆功能现已对所有 ChatGPT Plus 用户开放。使用记忆功能很简单:只需开始新的聊天并告诉 ChatGPT 您希望它记住的任何内容。

记忆功能可以在设置中开启或关闭,并且目前在欧洲或韩国不可用。团队、企业版和未来的 GPT 产品将陆续推出。

Phi-3 notebook 发布,Phi 的调优速度提高了 2 倍,且VRAM使用减少了50%

推特地址 模型地址

Phi-3 notebook 发布了!使用 @UnslothAI,相比于 HF+FA2,Phi 的调优速度提高了 2 倍,且 VRAM 使用减少了 50%!

由于采用了滑动窗口注意力机制,不得不对其进行 Mistral 化,并修复了 2048/2047 的 SWA(滑动窗口注意力)错误。还解除了注意力机制与 MLP(多层感知机)的融合,因此 QLoRA 损失有所不同,但 16 位的表现相同。

NVIDIA 与蔚来联合研究:使用张量并行技术进行自动驾驶感知模型训练

原文地址

文章探讨了 NVIDIA 与蔚来合作,利用张量并行技术优化自动驾驶感知模型的 GPU 内存使用。通过分片处理卷积神经网络(CNN)的输入和中间激活值,将它们均匀分配到多个 GPU 上,显著降低了对单个 GPU 的内存占用。

此外,文章详述了在 PyTorch 2.0 中使用 DTensor 实现张量并行的细节,包括模型参数和优化器状态的处理方式,以及卷积操作中必要的数据交换和通信。这种方法不仅提高了 GPU 的利用率,还允许使用更深的模型和更高的分辨率输入,从而提升自动驾驶感知模型的精度和训练效率。

产品投资

「星元AI」获数千万天使轮投资

近日,星元先创网络有限责任公司旗下产品「星元AI」完成了数千万的天使轮融资,此次成功融资为星元先创的发展注入新的活力,本轮资金将重点投向星元先创旗下系统升级和市场推广,为广大服务商提供更多机会。

对于星元先创而言,意味着有望将领先的数字化营销系统和人工智能领域的成就在现有基础上再上新台阶,增强核心竞争力,迅速扩大新兴市场的市场份额;合作也标志着星元先创进一步强化“人工智能+营销系统”的战略,星元先创将加速产品升级和业务全国布局。

微软宣布在印尼的云计算和 AI 领域投资 17 亿美元

官方报道

微软计划在接下来的四年内在印尼投资17亿美元,用于新的云计算和人工智能(AI)基础设施,以及为84万人提供AI技能培训,并支持该国日益增长的开发者社区。这是微软在印尼29年历史中的最大单笔投资。此举旨在帮助实现印尼政府的“2045年黄金印尼愿景”,该愿景旨在将印尼转变为全球经济强国。


我的本博客原地址:https://ntopic.cn/p/ai20240501


微信公众号:Python禅师

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/591714.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

无极花 专业韩语 朝鲜语网站建设

无极花 https://www.wujihua.com 无极花建站 - 始于2016年,专业的韩语、朝鲜语网站开发团队,从事网页设计、网站开发、网站托管、网站维护、网站推广、搜索引擎SEO优化等服务。

Qt5 框架学习及应用 — 对象树

Qt 对象树 对象树概念Qt为什么使用对象树 ?将对象挂到对象树上 对象树概念 对象树:对于树的概念,相信许多学过数据结构的同学应该都不会陌生。在学习数据结构的时候我们所接触的什么二叉树、多叉树、哈夫曼树、AVL树、再到红黑树、B/B树………

力扣例题(接雨水)

链接: . - 力扣(LeetCode) 题目描述: 思路: 判断一块地方是否可以接到雨水,只需要判断他是否有左右边界使他可以接到水 左右边界分别为此处左侧的最高点和右侧的最高点 同时此处可接雨水的高度为左右两…

力扣每日一题104:二叉树的最大深度

题目 给定一个二叉树 root ,返回其最大深度。 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 示例 1: 输入:root [3,9,20,null,null,15,7] 输出:3示例 2: 输入:root [1,null,2…

栈的表达式求值中的应用——逆波兰表达式求值+中缀表达式转后缀表达式

文章目录 1. 逆波兰表达式(后缀表达式)求值思路讲解AC代码 2. 中缀表达式转后缀表达式分析方法总结 3. 中缀表达式求值 1. 逆波兰表达式(后缀表达式)求值 链接: link 这道题目叫做逆波兰表达式求值,那什么是逆波兰表…

阿里云API网关 产品的使用笔记

阿里云的产品虽多,还是一如既往的一用一个看不懂,该模块的文档依旧保持“稳定”发挥,磕了半天才全部跑通。 用阿里云API网关的原因是,在Agent中写插件调用API的时候,需要使用Https协议,又嫌搞备案、证书等事…

【ROS学习】noetic环境搭建

ROS学习:环境搭建 在Ubuntu20.04系统中,搭建noetic环境。 官方资料: https://wiki.ros.org/noetic/Installation/Ubuntu 顺序执行以下所有指令 获取软件包 这里使用清华的镜像源,可以在https://wiki.ros.org/noetic/Installat…

办公数据分析利器:Excel与Power Query透视功能

数据分析利器:Excel与Power Query透视功能 Excel透视表和Power Query透视功能是强大的数据分析工具,它们使用户能够从大量数据中提取有意义的信息和趋势,可用于汇总、分析和可视化大量数据。 本文通过示例演示Power Query透视功能的一个小技…

JavaScript基础(四)

逻辑运算符 && 与 : 多个条件同时满足 ΙΙ 或 : 多个条件满足一个 &#xff01; 非 : 否定某个条件 例: <script> //&多个条件同时满足&#xff0c;才返回true //任意一个为false&#xff0c;就返回false var a 10; var b 20; …

主机win10,VMware 装了ubuntu,ubuntu传文件到主机

亲测可用&#xff0c;1分钟搞定&#xff0c;不能用你打死我 使用 FileZilla 工具互传 FileZilla是一款免费的工具&#xff0c;是基于 FTP 协议进行文件互传的&#xff0c;在传输过程中我们的ubuntu是作为服务器&#xff0c; FileZilla 工具则是作为客户端。 1 ubuntu安装 FTP…

typescript 对象数组和函数

typescript 对象数组和函数 对象 在JavaScript中&#xff0c;对象属于非原始类型。对象也是一种符合数组类型&#xff0c;由若干个对象属性构成。对象属性可以是任意数据类型&#xff0c;比如数组&#xff0c;函数或者对象等。当对象属性为函数的时候&#xff0c;称为方法。 …

基于Spring Boot的音乐网站与分享平台设计与实现

基于Spring Boot的音乐网站与分享平台设计与实现 开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/idea 系统部分展示 系统功能界面图&#xff0c;在系统首页可以查看首…

phpMyAdmin增加自定义IP登录教程

phpMyAdmin增加自定义IP登录教程 1、打开phpMyAdmin目录&#xff0c; 在此目录下是否有config.sample.inc.php文件&#xff0c;如果存在&#xff0c;那么将其改名为config.inc.php&#xff08;为避免修改失误所造成的损失&#xff0c;强烈建议先备份config.sample.inc.php文件…

matlab期末知识

1.期末考什么&#xff1f; 1.1 matlab操作界面 &#xff08;1&#xff09;matlab主界面 &#xff08;2&#xff09;命令行窗口 &#xff08;3&#xff09;当前文件夹窗口 &#xff08;4&#xff09;工作区窗口 &#xff08;5&#xff09;命令历史记录窗口 1.2 matlab搜索…

U盘启动树莓派系统操作流程(3B+)

步骤 使用SD Card启动修改树莓派硬件启动方式 已烧写好的SD Card先 config.txt文件最后一行配置 program_usb_boot_mode1 program_usb_boot_timeout1 ## 超时时间加大到5s, 避免硬件USB枚举时过长导致启动超时。 SD Card接入树莓派&#xff0c; 然后上电, 使用指令 vcgencm…

「2024年」前端开发常用工具函数总结 TypeScript

前言 在前端开发中&#xff0c;工具函数是提高代码复用率、保持代码整洁和增加开发效率的关键。使用 TypeScript 编写工具函数不仅可以帮助开发者捕捉到更多的类型错误&#xff0c;还可以提供更清晰的代码注释和更智能的代码补全。下面是一些在 TypeScript 中常用的前端开发工…

搜好货API接口:快速获取商品列表的利器

搜好货商品列表API接口允许开发者根据关键字搜索并获取相关的商品列表数据。接口支持多种参数配置&#xff0c;可以根据需求灵活调整搜索条件和结果返回格式。 点击获取key和secret API接口请求说明 请求地址&#xff1a;https://api.souhaohuo.com/goods/search请求方法&…

Java——认识异常

目录 一.异常的概念与体系结构 1.异常的概念 1.1算术异常 1.2数组越界异常 1.3空指针异常 2.异常的体系结构 3.异常的分类 3.1编译时异常 3.2运行时异常 二.异常的处理 1.防御式编程 1.1LBYL 1.2EAFP&#xff08;核心&#xff09; 2.异常的抛出 3.异常的捕获 3…

主流Text2Image技术学习

DDPM原理 DDPM&#xff08;Denoising Diffusion Probabilistic Models&#xff09;是一种生成模型&#xff0c;它通过模拟数据的扩散过程来生成新的数据样本。 DDPM通过一个随时间增加噪声的扩散过程和一个逐步去除噪声的生成过程来模拟数据分布。其核心在于训练一个去噪声模…

Steam新人下载安装教程分享 迅游一键下载安装steam

Steam平台是Valve公司聘请的BitTorrent协议&#xff08;BT下载&#xff09;发明者Bram Cohen亲自开发设计。国内玩家对于Valve公司的游戏不会陌生&#xff0c;该公司发行的游戏有半条命系列、反恐精英系列、求生之路系列、传送门系列、军团要塞2、Dota2。Steam平台的客户端新增…
最新文章