AOMedia发布免版税沉浸音频规范IAMF

11月10日,开放媒体联盟(AOMedia)发布了旗下首个沉浸式音频规范IAMF(https://aomediacodec.github.io/iamf/),IAMF是一种编解码器无关的容器规范,可以携带回放时间渲染算法和音频混音的信息,而且和旗下的AV1视频标准一样为免版税。

从AV1开始,AOMedia就在用开放来对抗老牌的标准组织ITU与ISO/IEC的HEVC、VVC等标准。目前,AV1已经成为主流视频平台的主力标准,包括Netflix、Meta、苹果等都在持续扩大AV1的应用部署。同样,IAMF也自然成为对抗商业沉浸式音频方案的主力。目前,业界影响力最大的沉浸式音频解决方案是杜比(Dolby Atmos),苹果就采用了Dolby Atmos作为自身沉浸式音频的解决方案。考虑到杜比在多媒体生产与消费领域拥有全方位的渗透,苹果选择杜比是顺其自然的。此外,全景声科技也是沉浸式音频主要的解决方案商。

AV1的成功在于AOMedia把多媒体各个关键环节的企业拉到了一起,从内容生产侧的工具、内容IP所有者,分发渠道OTT,终端设备商、芯片和关键技术服务商。当然,AV1的成功也得益于HEVC混乱的版税机制的助攻。

9642852b1f218190428fb4e90605c499.jpeg

根据三星发布的新闻稿显示,IAMF项目始于2020年,由三星和Google共同开发,并最终成为AOMedia发布。三星是AOMedia的创始成员。尽管苹果也是AOMedia创始成员,但在自己的生态中依然采用了更加成熟的Dolby Atmos作为沉浸式音频解决方案。AOMedia的成员中还包括Amazon、Meta、微软、Netflix、腾讯、oppo、Vimeo等内容平台方,这些平台的选择将很大程度决定IAMF的命运。

IAMF的关键亮点如下:

适用于所有设备的空间音频:IAMF可以将基于通道和基于场景的全景声空间音频演示无缝传送到包括耳机、移动电话、电视机、家庭影院和网络在内的各种设备上。这种多功能性确保在各个平台上提供一致的高质量音频体验。

灵活的音频传输:IAMF提供了一种灵活的方法,可以将不同类型的音频元素传输到终端设备上。无论是将3.1.2通道音频与立体声音频相结合,IAMF都可以实现。IAMF提供了一种信号渲染算法(例如EAR和BEAR)的方式,以便在扬声器布局和耳机中播放。

创作者友好:创作者可以使用现有的开源插件,如EAR Production Suite,开始创建符合IAMF规范的沉浸式音频内容,该插件包括多扬声器布局和双耳监控的渲染器。IAMF能够携带并包含多个音频混音配置,使创作者和用户能够根据不同的播放偏好进行可控的响度调整。在不久的将来,AOMedia开源参考软件将添加一种IAMF编码工具,用于将各种音频混音压缩为IAMF。

AI驱动:IAMF利用人工智能和深度学习技术来分析场景,并突出内容的某些方面,调整音频水平以增强整个观看体验中的声音效果。使用IAMF技术,用户将能够根据自己的喜好自由调整声音。无论观众想要增强动作场景的音效还是增强对话的清晰度,IAMF都为他们提供了自定义内容音频的灵活性,以实现更个性化的体验。

你可以在这里(https://github.com/AOMediaCodec)找到IAMF规范和参考软件解码器,以及完整的测试流。

据三星研究院视觉技术团队的WooHyun Nam透露,三星研究团队目前正在开发IAMF技术的高级版本,可应用于移动设备、元宇宙、视频游戏等领域。

参考信息:

https://aomedia.org/press%20releases/AOMedia-Advances-the-Audio-Innovation-Era/

https://news.samsung.com/global/interview-movie-quality-audio-from-the-comfort-of-your-home-meet-the-leaders-of-next-generation-3d-audio-technology

c774d72dadfcd1039a805f14da742d9d.png

▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/137431.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Spring Data JPA 实现集成实体对象数据库的创建、修改时间字段自动更新

JPA提供了一种事件监听器的机制,用于SQL审计,通过监听器我们可以很快速地去自动更新创建时间、修改时间,主要步骤如下: 一、创建基础实体,包含了创建和修改时间,然后让其他真正的实体继承该实体&#xff0…

59基于matlab的爬行动物搜索算法(Reptile search algorithm, RSA)

基于matlab的爬行动物搜索算法(Reptile search algorithm, RSA)一种新型智能优化算法。该算法主要模拟鳄鱼的捕食行为,来实现寻优求解,具有收敛速度快,寻优能力强的特点。程序已调通,可直接运行。 59matlab…

3分钟带你了解前端缓存-HTTP缓存

前情提要 前端缓存分为下面三大类,本文主要讲解HTTP缓存~ 1. HTTP缓存 强缓存协商缓存 2. 浏览器缓存 本地小容量缓存本地大容量缓存 3. 应用程序缓存 HTML5应用程序缓存 缓存作用 减少了冗余的数据传输减少服务器的负担提高了网站的性能加快加载网页速度 …

JPA Buddy快速创建update、find、count、delete、exists方法

JPA Buddy快速创建update、find、count、delete、exists方法,JPA默认提供的CrudRepository\JpaRepository提供的方法比较少,一般我们会手写一些方法,这里我们选择通过JPA Buddy快速生成,之前文章中讲到了JPA Buddy原本是IDEA收费插…

未来的拥塞控制与 Linux EEVDF 调度器

有破要有立。 前面提到 经典端到端拥塞控制将越来越失效,未来该如何,谈谈我的看法。 端到端拥塞控制的难点根本上是要解决公平性问题,顺带着提高资源利用率。我们很容易理解,在共享资源场景下,不公平一定是低效的&am…

Redis的特性以及使用场景

分布式发展历程参考 陈佬 http://t.csdnimg.cn/yYtWK 介绍redis Redis(Remote Dictionary Server)是一个基于客户端-服务器架构的在内存中存储数据的中间件,属于NoSQL的一种。它可以用作数据库、缓存/会话存储以及消息队列。 作为一种内存数…

【Pytorch和深度学习】栏目导读

一、栏目说明 本栏目《pytorch实践》是为初学者入门深度学习准备的。本文是该栏目的导读部分,因为计划本栏目在明年完成,因此,导读部分,即本文也在持续更新中。 本栏目设计目标是将深度学习全面用pytorch实践一遍,由浅…

原型模式 rust和java的实现

文章目录 原型模式介绍优点缺点使用场景 实现java 实现rust 实现 rust代码仓库 原型模式 原型模式(Prototype Pattern)是用于创建重复的对象,同时又能保证性能。 这种模式是实现了一个原型接口,该接口用于创建当前对象的克隆。当…

mysql主从复制-使用心得

文章目录 前言环境配置主库从库 STATEMENTbinloggtidlog-errorDistSQL总结 前言 mysql 主从复制使用感受,遇到一些问题的整理,也总结了一些排查问题技巧。 环境 mysql5.7 配置 附:千万级数据快速插入配置可以参考:mysql千万数…

数据分析面试题1

1.右表为一组数据,尝试进行简单分析,并给出结论(使用公式和图表辅助) ①理解数据 userid:用户id神兽印记消耗数量 ②数据清洗 冻结首行,将列标题的英文字段转换成汉字字段检查是否有重复项:…

STM32F407: CMSIS-DSP库的移植(基于源码)

上一篇:STM32F407: CMSIS-DSP库的移植(基于库文件)-CSDN博客 1. 拷贝源码 仿照官方源码目录,新建一个source目录:\Drivers\CMSIS\DSP\Source 将所有源文件拷贝过来,如下: 然后在每个目录下新建一个总的c文件&#x…

CSS花边001:无衬线字体和有衬线字体

网站中我们看到过很多字体,样子各有千秋。通常针对结构,区分为有衬字体(serif) 和无衬字体(sans-serif)。今天我们聊一下这个话题。 什么是有衬字体,什么是无衬字体? 衬线字体&…

sqli-labs关卡16(基于post提交的双引号加括号闭合的布尔盲注)通关思路

文章目录 前言一、回顾上一关知识点二、靶场第十六关通关思路1、判断注入点2、猜数据库长度3、猜数据库名字4、猜表名长度5、猜表名名字6、猜列名长度7、猜列名名字8、猜数据长度9、猜数据名字 总结 前言 此文章只用于学习和反思巩固sql注入知识,禁止用于做非法攻击…

已解决:java.net.BindException: 地址已在使用

解决zookeeper报错:java.net.BindException: 地址已在使用,是因为端口被占用。显示Starting zookeeper ... STARTED,jps没有QuorumPeerMain进程。 问题截图: 看似Starting zookeeper ... STARTED,实则集群并没有启动…

逻辑回归-癌症病预测与不均衡样本评估

1.注册相关库(在命令行输入) pip install scikit-learn pip install pandas pip install numpy 2.导入相关库 import pandas as pd import numpy as np from sklearn.metrics import classification_report from sklearn.model_selection import train_test_split…

【每日一题】—— B. Deja Vu(Codeforces Round 907 (Div. 2))(暴力枚举、队列)

🌏博客主页:PH_modest的博客主页 🚩当前专栏:每日一题 💌其他专栏: 🔴 每日反刍 🟡 C跬步积累 🟢 C语言跬步积累 🌈座右铭:广积粮,缓称…

“苹果定律”失效,2023是VR的劫点还是拐点?

因为Pico裁员的事情,VR行业又被讨论了。 Pico于2021年9月被字节跳动收购,当时是出货量排名全球第三的VR 头显生产商。 此前曾有国际机构预测,2023年随着Meta和Pico的硬件更新,苹果Vision Pro的推出,三星电子重新回归VR…

黑马程序员微服务Docker实用篇

Docker实用篇 0.学习目标 1.初识Docker 1.1.什么是Docker 微服务虽然具备各种各样的优势,但服务的拆分通用给部署带来了很大的麻烦。 分布式系统中,依赖的组件非常多,不同组件之间部署时往往会产生一些冲突。在数百上千台服务中重复部署…

初探地理编码(2023.11.12)

地理编码相识 2023.11.12 引言1、地理编码简介2、地理编码API和服务(解决方案供应商 / 厂商)2.1 高德2.2 百度2.3 超图2.4 天地图2.5 ArcGIS2.6 MapBox2.7 Cesium2.8 MapLocation 3、python实例3.1 pip安装依赖库(python 3.6)3.2 …

git分支与tag标签的介绍与使用)

git分支与tag标签的介绍与使用 一.什么是分支与标签1.2.开发环境分层 二git分支介绍2.1分支操作2.2.IDEA中操作分支 三、Git标签的讲解3.1.GitBashHere操作标签3.2. IDEA中操作标签 一.什么是分支与标签 分支(Branches): 功能开发&#xff…