AI又进化了

  • B站:啥都会一点的研究生
  • 公众号:啥都会一点的研究生

一直想做但没做的板块,整理一段时间内AI领域的前沿动态(符合大多粉丝研究领域/感兴趣方向),了解了解外面世界发展成啥样了,一起看看吧~

谷歌Chrome推出“Help me write”的AI功能

谷歌最近在其Chrome浏览器中推出了一个名为“Help me write”的实验性AI功能。这个由Gemma提供支持的功能旨在帮助用户根据网页内容编写或完善文本,专注于为短格式内容提供写作建议,例如填写数字调查和评论,以及起草在线销售商品的描述

该工具可以理解网页的上下文,并将相关信息引入其建议中,例如在产品页面上突出显示的关键功能,用于商品评论。用户可以在任何网站的文本字段上右键单击以使用该功能

在这里插入图片描述

https://blog.google/products/chrome/google-chrome-ai-help-me-write/

LongRoPE:将LLM上下文窗口扩展到超过200万个token

微软提出了LongRoPE,将预训练大型语言模型(LLMs)的上下文窗口扩展到惊人的2048k tokens

由于高微调成本、长文本的稀缺性以及新标记位置引入的灾难性数值,目前的扩展上下文窗口受到了约128k个token的限制,LongRoPE克服了这些问题

对LLaMA2和Mistral在各种任务上的实验表明,扩展模型保留了原始架构,并进行了轻微的位置嵌入修改和优化

在这里插入图片描述

https://twitter.com/_akhaliq/status/1760499638056910955

Stable Diffusion 3打造更强的文生图模型

Stability.AI在早期预告中宣布了Stable Diffusion 3。一款文生图模型,在多主题提示、图像质量和拼写能力方面表现出了更高的性能

由于其卓越的能力,这款下一代图像工具在AI社区中引起广泛关注。宣称提供更好的文本生成,强大的提示遵循能力以及对提示泄漏的抵抗力,确保生成的图像与请求的提示相匹配

在这里插入图片描述

https://blog.google/products/google-one/google-one-gemini-ai-gmail-docs-sheets

AnyGPT:迈向通用人工智能的重要一步

上海团队通过研发 AnyGPT 实现了AI能力上的突破。AnyGPT 几乎可以理解和生成任何模式的数据,包括文本、语音、图像和音乐。利用创新的离散表示方法,使单一的底层语言模型架构能够流畅地处理多种模式的输入和输出

在这里插入图片描述

https://arxiv.org/pdf/2402.12226.pdf

Google 发布了第一个开源LLM

谷歌开源了 Gemma,这是一个全新的先进语言模型系列,有 2B 和 7B 两种参数规格。尽管 Gemma 模型非常轻便,可以在笔记本电脑和台式机上运行,但它采用了与谷歌庞大的专有 Gemini 模型相同的技术并实现了卓越的性能,在许多关键的自然语言处理基准测试中,7B Gemma 模型的性能超过了 13B LLaMA 模型

此外,谷歌还发布了 “负责任的生成式人工智能工具包”,以帮助开发人员构建安全的应用程序。其中包括基于谷歌经验的稳健安全分类、调试模型行为和实施最佳部署实践的工具。Gemma 可在谷歌云、Kaggle、Colab 和其他一些平台上使用,并提供免费积分等激励措施

在这里插入图片描述

https://blog.google/technology/developers/gemma-open-models

Meta 发布 Aria 录音,助力智能语音识别

Meta 发布了通过 Aria 智能眼镜捕捉到的双人对话多模式数据集。该数据集包含 7 个麦克风的音频、视频、运动传感器和标注。一名参与者戴着眼镜自发地与另一名贡献者交谈

该数据集旨在推动语音识别、扬声器 ID 和增强现实界面翻译等领域的研究。它的音频、视觉和运动信号共同提供了丰富的自然对话捕捉,有助于训练人工智能模型,可以实现闭合字幕和实时语言翻译

在这里插入图片描述

https://the-decoder.com/metas-aria-smart-glasses-dataset-helps-shape-the-future-of-ai-conversations/

Adobe 发布新AI助手帮助用户浏览文档

Adobe 在其 Acrobat 软件中推出了一项AI助手功能,帮助用户浏览文档,可以总结内容、回答问题并生成格式化的概述。该聊天机器人旨在节省处理长文件和复杂信息的时间

此外,Adobe 还专门成立了一个 50 人的人工智能研究团队,名为 CAVA(音频、视频和动画协同创作),专注于推进生成式视频、动画和音频创作工具的发展。该研究小组将探索将 Adobe 现有的创意工具与文本视频生成等技术相结合

在这里插入图片描述

https://www.theverge.com/2024/2/20/24077217/adobe-acrobat-generative-ai-assistant-chatbot-pdf-document

Groq 的新型AI芯片为助力LLM,性能优于 ChatGPT

Groq 开发了一种特殊的人工智能硬件,称为有史以来第一个语言处理单元(LPU),旨在提高目前通常在 GPU 上工作的人工智能模型的处理能力。这些 LPU 每秒可处理多达 500 个token,远远优于每秒只能处理 30 至 50 个token的 Gemini Pro 和 ChatGPT-3.5

在这里插入图片描述

该公司将基于 LPU 的人工智能芯片命名为 “GroqChip”,采用了一种 “张量流架构”,复杂性低于传统 GPU,可实现更低的延迟和更高的吞吐量。使得该芯片成为体育直播或游戏等实时人工智能应用的理想选择

https://the-decoder.com/groqs-ai-chip-turbocharges-llms-and-generates-text-in-near-real-time/

谷歌开源人工智能文件类型识别器 Magika

谷歌开源了其人工智能驱动的文件类型识别系统Magika,以帮助准确检测二进制和文本文件类型。Magika采用了一个定制的、高度优化的深度学习模型,即使在CPU上运行,也能在几毫秒内实现精确的文件识别

得益于其人工智能模型和大型训练数据集,Magika 的性能比其他现有工具高出约 20%。它在文本文件(包括其他工具难以处理的代码文件和配置文件)上的性能提升更大

在这里插入图片描述

在内部,Magika 被大规模用于将 Gmail、Drive 和安全浏览文件路由到适当的安全和内容策略扫描程序,从而帮助提高谷歌用户的安全性

https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html

NVIDIA的新数据集提高了LLMs数学能力

英伟达发布了开源数学指令调整数据集 OpenMathInstruct-1,该数据集包含 180 万个问题-解决方案对。OpenMathInstruct-1 是一个高质量的合成数据集,比以前的数据集大 4 倍,而且不使用 GPT-4,通过使用 Mixtral 模型合成 GSM8K 和 MATH(两种流行的数学推理基准)的代码解释器解决方案而构建

https://arxiv.org/abs/2402.10176

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/424894.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

跟 AI 学 StarRocks:简介

因为要支持公司的 BI 建设,团队引入了 StarRocks 数据库,此前我没有了解过此项技术,不过因为有架构师引入了此项技术栈,就顺便学习一下。 一、什么是 MPP 数据库? MPP 数据库指的是大规模并行处理(Massiv…

Hololens 2应用开发系列(2)——MRTK基础知识及配置文件配置(上)

Hololens 2应用开发系列(2)——MRTK基础知识及配置文件配置 一、前言二、MRTK基础知识2.1 MRTK概述2.2 MRTK运行逻辑2.3 MRTK配置文件介绍2.4 MRTK服务 三、配置文件使用3.1 总配置文件3.2 相机配置3.3 其他配置 参考文献 一、前言 在前面的文章中&…

DDR5 新特性概述

主页: 元存储博客 文章目录 前言1. SDR 与 DDR2. DDR5 的新特点总结 前言 DDR5 带来更快的处理速度和更大的存储空间,为云计算、大数据等领域的发展提供了强有力的支持。 1. SDR 与 DDR single data rate, 1 个时钟周期做一次数据传输 do…

更改elementui的箭头图片以及位置

//更改箭头位置 .el-tree-node__content > .el-tree-node__expand-icon {position: absolute;right: 12px; }//更改箭头图片 .el-tree-node__expand-icon {transform: rotate(-90deg); } .el-tree-node__expand-icon.expanded {transform: rotate(0deg); } // 有子节点 且已…

使用QEMU搭建U-Boot+LinuxKernel+busybox+NFS嵌入式开发环境

目录 0.课程大纲1.为什么要使用QEMU学习嵌入式QEMU简介使用QEMU可以做哪些事情?当前嵌入式行业现状如何适应这种变化使用QEMU学习嵌入式有哪些好处?驱动开发技能为什么要学习Linux 2.搭建嵌入式开发基本环境2.1.安装u-boot-tools2.2.安装交叉编译工具什么是ABI和EABI 3.QEMU安…

DSI2协议之BTA行为理解

概念: DSI协议spec支持总线控制权在master和slave之间发生交换,即通过bus turn around来实现; BUS TURN AROUND: BTA 的实现是通过controller—>cdphy的turnrequest信号来实现; 关于控制器发出turnrequest给phy,phy通过lvds/trio线输出turnaround sequence如下图中…

C++基于多设计模式下的同步异步日志系统day3

C基于多设计模式下的同步&异步日志系统day3 📟作者主页:慢热的陕西人 🌴专栏链接:C基于多设计模式下的同步&异步日志系统 📣欢迎各位大佬👍点赞🔥关注🚓收藏,&am…

C习题002:澡堂洗澡

问题 输入样例 在这里给出一组输入。例如&#xff1a; 2 5 1 3 3 2 3 3 输出样例 在这里给出相应的输出。例如&#xff1a; No代码长度限制 16 KB 时间限制 400 ms 内存限制 64 MB 栈限制 8192 KB 代码 #include<stdio.h> int main() {int N,W,s,t,p;int arr_s[…

投影和定义投影的区别

Arcmap中关于投影的工具有四个&#xff0c;分别是定义投影、投影、投影栅格、批量投影。这四个工具既有相同之处也有不同之处&#xff0c;下面我将一一介绍。 ①定义投影&#xff1a;Arcmap中关于定义投影工具是这样描述的&#xff1a;“所有地理数据集均具有一个用于显示、测…

小白必看的Python函数讲解

定义函数 我们通过斐波那契数列来理解定义函数 >>> def fib(n): # 将斐波那契数列打印到 n ... """将斐波那契数列打印到 n""" ... a, b 0, 1 ... while a < n: ... print(a, end ) ... a, b b, …

【Linux安装软件命令及vim、gcc使用说明】

安装软件命令 Linux安装软件的命令首先要进入管理员权限 首先在终端输入sudo su切换到管理员界面 输入对应的密码&#xff0c;注意这里的密码不会显示出来&#xff0c;输完密码之后回车即可。当出现root就代表已经是管理员界面了。 如果相应退出管理员界面输入exit即可。 注…

出现这6点症状,不要拖延,不然植物神经紊乱会找到你!

植物神经紊乱&#xff0c;是一种由于自主神经系统失衡引起的疾病。自主神经系统主要负责调节人体内脏器官的功能&#xff0c;包括心脏、血管、消化系统等&#xff0c;一旦失衡将导致一系列不适症状。植物神经紊乱的主要原因包括长期的焦虑、压力、过度疲劳、情绪波动、生活节奏…

从零开始的二进制漏洞挖掘(1)路由器漏洞挖掘(去实战版)

前言 路由器的洞大部分都是栈溢出&#xff0c;如果想要了解一些相关的知识&#xff0c;可以去看我的pwn和二进制安全虚拟机Protostar靶场系列文章&#xff0c;传送门&#xff1a; https://blog.csdn.net/qq_45894840/category_12002228.html?spm1001.2014.3001.5482ghidra安…

2024全新手机软件下载应用排行、平台和最新发布网站,采用响应式织梦模板

这是一款简洁蓝色的手机软件下载应用排行、平台和最新发布网站&#xff0c;采用响应式织梦模板。 主要包括主页、APP列表页、APP详情介绍页、新闻资讯列表、新闻详情页、关于我们等模块页面。 地 址 &#xff1a; runruncode.com/php/19703.html 软件程序演示图&#xff1a;…

领域驱动设计(Domain-Driven Design DDD)——战略设计1

一、概述 随着系统的增长&#xff0c;它会越来越复杂&#xff0c;当我们无法通过分析对象来理解系统的时候&#xff0c;就需要掌握一些操纵和理解大模型的技术了。 最负雄心的企业欲实现一个涵盖所有业务、紧密集成的系统。因大型公司的业务模型巨大且复杂&#xff0c;很难把它…

Elasticsearch:如何创建搜索引擎

作者&#xff1a;Jessica Taylor 搜索引擎是生活中我们认为理所当然的事情之一。 每当我们寻找某些东西时&#xff0c;我们都会将一个单词或短语放入搜索引擎&#xff0c;就像魔术一样&#xff0c;它会为我们提供一个匹配结果列表。 现在可能感觉不那么神奇了&#xff0c;因为这…

【CSS】(标准流部分)易忘知识点汇总

一、元素 块元素 常见的块元素&#xff1a; <h1>~<h6>、<p>、<div>、<ul>、<ol>、<li>行内元素 常见的行内元素&#xff1a; <a>、<strong>、<b>、<em>、<i>、<del>、<s>、<ins&…

卷积神经网络CNN

图像基础知识 图像是由像素点组成的&#xff0c;每个像素点的取值范围为 : [0, 255] 。像素值越接近于 0 &#xff0c;颜色越暗&#xff0c;接近于黑色&#xff1b;像素值越接 近于255 &#xff0c;颜色越亮&#xff0c;接近于白色。 在深度学习中&#xff0c;我们使用的图像…

图神经网络实战——图论基础

图神经网络实战——图论基础 0. 前言1. 图属性1.1 有向图和无向图1.2 加权图和非加权图1.3 连通图和非连通图1.4 其它图类型 2. 图概念2.1 基本对象2.2 图的度量指标2.2 邻接矩阵表示法 3. 图算法3.1 广度优先搜索3.2 深度优先搜索 小结系列链接 0. 前言 图论 (Graph theory) …

@Transactional--开启事物后换源报错

一、问题出现的场景 系统架构设计、每个企业一个企业库、通过数据源切在平台库、和企业库之间动态切换完成业务操作。 二、跨库事物失效的原因 1、SpringTransactional不支持跨数据源事物&#xff0c;Spring 事物控制是基于数据库链接进行的&#xff0c;当数据源切换后&#x…