小米SU7智能座舱揭秘:五音区语音交互,智能语音新体验

“小爱同学,打开右后方车门。”

“小爱同学,前面的山是什么山?”

“小爱同学,有没有离簋街和望京都比较近的川菜馆?”

“小爱同学,右后视镜向外调20%,左后视镜往里调10%。”

“小爱同学, ...... ”

搭载在小米SU7上的小爱同学,有了全新的升级!它更像是一位十八般武艺样样行的“大管家”,能照顾到每一位乘客的问答需求,为大家提供丰富的多人场景服务。凭借更高灵敏度的语音功能,精准识别车内五个不同位置的发声区域,及时响应不同座位上的各种需求。即使在高噪声环境下,小爱同学也能保持敏锐的听觉,时刻陪伴,为大家带来满满的出行愉悦体验!

那么,如此聪明且贴心的小爱同学究竟升级了哪些技能呢?又是如何做到能方方面面照顾到多个乘车人的需求的?走,一起探索小爱同学智慧养成的 SSS 级机密~

01 

五座五音区交互功能

小爱应答更灵敏

什么是五音区技术?这可不是什么高深的音乐理论,而是小米SU7为大家打造的智能语音新体验!五座五音区比通行的五座四音区体验更佳,后排中间乘客语音体验更友好。

小米SU7对五个音区的边界进行了细致入微的调整,轻声一唤“小爱同学”,即可控制音乐播放、调整空调温度等,无需分心操作繁琐的物理按键或触摸屏。它可以在多人环境中,精准识别不同发声区域,及时响应需求,保证即便是后排中间位置的乘客,也能通过语音流畅地与系统进行交互,不受左右两边的干扰。此外,支持分区权限管理,涉及影响驾驶安全的语音指令,只有主驾说才有效。

8c931f94090d6bfcc6e9caadcb218529.png

这就像在车内建立了五个独立的“声音房间”,每个人都拥有自己的私密空间,可以在这一方小天地里自由呼唤小爱同学,而不用担心声音会“泄露”到其他区域,同时也不用担心自己需求被误听或忽略。

那么,这一切是如何实现的呢?秘诀就在于自研五音区拾音算法!五音区拾音算法具有极高的音区划分能力,基于全车部署的3个麦克风模组合计8颗 MIC ,通过混合间距麦克风阵列算法,计算每个音区的谱能量矩阵,指导音区分离,结合每个音区内的声学信号比对与音区边界划分决定哪位乘客在音区唤醒了“小爱同学”。

更贴心的是,如果你想放倒座椅小憩一下,小米SU7的五音区技术也能自适应调整。它采用业内领先的座椅信号和座椅后仰幅度算法策略,无论前排座位如何调整,都能保障你的语音体验不受影响。小米SU7五音区技术,不惧多人同行,让唤醒小爱同学更轻易!前后排语音交互互不干扰;覆盖后排中间位置,第五音区也能拥有智能对话体验。

02 

座舱噪声抑制

嘈杂环境语音交互的守护者

多人出行场景下,无论是车内狂欢派对,还是朋友间的纵情嗨唱,高噪声总是伴随着欢乐与挑战。传统的智能助手很可能因为环境噪声过大而无法准确识别用户的指令。然而,这一切对于小米SU7来说都不在话下!

它将神经网络与麦克风阵列多级降噪分离算法深度融合,形成了一套独特而高效的语音识别系统。这套系统充分发挥了深度神经网络算法和传统阵列信号处理算法的优势,能够有效地抑制传导至座舱内的各种噪声,包括胎噪、路噪、风噪和其他路面的情境噪声,以及舱内的音乐、混响、空调声和非交互人声等。这意味着,无论是在摇滚音乐的狂欢中,还是在空调大开、车辆高速行驶的嘈杂环境里,小爱同学都能清晰地捕捉到用户的每一个指令。

566e102224199bd9c252ac824662afd6.png

小爱同学,作为小米SU7的智能助手,可谓是嘈杂环境中语音交互的得力“守护者”。在座舱噪声抑制技术的支持下,能让用户在高噪声场景下享受到及时、准确的智能服务。

03 

多信号误唤醒抑制

唤醒应答精准无误

在主驾驶和副驾驶位置上,小米SU7也结合了座椅信号、声学信号等信息,并基于小爱同学多年打磨的极致误唤醒算法,做到误唤醒率被大幅降低,确保在各种情境下都能为用户提供卓越的“防误唤醒”体验。

得益于多信号误唤醒抑制技术的加持,小爱同学的听觉识别能力得到了显著提升,“耳朵”变得更为敏锐和精准。

33ce589a155053867e44607d789fa3be.png

在车内任何时段,它都能有效避免对“我的同学”等含糊相似音的误唤醒;即使在对话中无意提及“小爱同学”,如“车上的小爱同学确实挺好用的”,但并无实际唤醒意图时,小爱同学也会保持沉默,不会误应答;对于主驾驶和副驾驶位置,小米SU7也结合了座椅信号、声学信号等信息,并基于小爱同学多年打磨的极致误唤醒算法,误唤醒率被大幅降低,即便车机播放小爱的声音、风噪、车外噪音或车内声音反射,也不会轻易触发误唤醒。

特别是,当后排无人乘坐时,小米SU7会自动启动“后排无人模式”,此时后排座位的所有唤醒指令都将被智能屏蔽,确保不会出现唤醒事件。

04 

首创整车内麦克风阵列自测试系统

保障小米SU7卓越品质

为了保障小米SU7用户都能尽情享受语音交互功能的魅力,每一台小米SU7在出厂前都会经历一场严格的“考验”。小米声学语音团队首创整车内麦克风阵列自测试系统,确保每一颗麦克风都能达到预期的声学效果,让所有小米SU7用户都能享受到清晰、准确的语音交互体验,驾驶之旅更加轻松愉悦!

012b1fc09d28bda0874c536d2dc99e4c.jpeg

在竞争激烈的消费电子行业中,手机、耳机等高端精密产品通常需要经过严苛的麦克风声学测试,以保障用户体验。然而对于汽车这种体积庞大、结构复杂的产品,其座舱内麦克风开展有效的声学测试非常困难。

同时,受限于产线条件、测试环境以及成本和效率等多重制约因素,大多数汽车厂商往往仅对车载麦克风进行功能测试,或者在装配前对麦克风模组进行声学测试。这些方法难以全面、准确地评估最终装配上车的麦克风声学性能,从而无法保证车载多音区语音交互的优质用户体验。

面对行业难题,小米不仅没有选择妥协,甚至采用了与手机、耳机等精密电子产品上的同等级的麦克风声学测试标准。首创适用于座舱内麦克风阵列自测试的系统及方法专利,此项技术可以在生产产线恶劣声学环境下,无需依赖专业设备和人力,实现自动化、高效且精准地检测车内每颗麦克风的声学特性,能够做到高准确率地测试每一辆小米SU7麦克风的频响、灵敏度、相位等关键声学指标,确保小爱同学唤醒率高达 98% 以上,在短短的 20s 内对全车检测完毕。让每一辆出厂的小米SU7都经过严格的检测,拥有卓越的品质与性能,为用户带来极致的语音交互体验!

05

降噪唤醒全链路工作方法

引领行业前沿水准

小米SU7是小米推出的第一款汽车,从立项之初就明确要采用全栈自研算法,并达到行业领先水平。而小米SU7的全栈自研也并非从车开始,早在造车之前就已经打下了深厚的技术基础。

小爱同学从2016年开始践行研发全栈自研理念,已经在手机、音箱、电视等万千终端,持续多年打磨用户体验,积累了海量数据,形成了一套高度成熟的降噪唤醒算法产研测团队,与覆盖硬件设计与准入、生产产线检测、算法预研与落地、多维数据采集、声学实验室建设与客观评测、主观评测与迭代等完善的全链路软硬件流程。

55faa8abe0df95a587b9736aa9943f3a.png

小米SU7音区唤醒算法研发过程中,小爱同学的海量数据积累成为了重要支撑。整个产研测团队适配了汽车产业流程中的全部关键阶段的工程试制车、准量产车等等,路测了上千个场景、上万公里、积累上万小时的核心场景与各种极端场景的实车数据;同时基于小米汽车整体的长期批量全国路测、以及小米座舱实验室数据仿真模拟,总共积累了数万小时的实车真实场景数据,用于音区唤醒算法迭代,最终实现了业内领先的五音区唤醒体验。

-

让每一位小米用户都能享受到极致的语音交互功能,是小米工程师始终坚守的心愿和矢志不渝的目标。小米不断创新和优化语音交互技术,力求为用户带来更加出色、更加便捷的语音交互体验。

相信在小爱同学卓越的语音交互功能陪伴下,无论是独自驾驶小米SU7,还是与亲朋好友一同出行,智能的出行体验,都能给旅途带去更多的轻松与惬意,让每一次的出发都沉浸在舒适与便捷之中。

dd75fc6703ec3000721e676012b8fa5b.png

0b11c0b105b5773de3a18bcca2a603bb.gif

fbe2448ceebea21555ee4ccb18d6a9be.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/607973.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

AI电视起风,三星电视打破“隔代飞跃”,在AI纪元再次领跑

作者 | 曾响铃 文 | 响铃说 要说什么是当下最热的话题,刚落下帷幕的北京车展一定是其中之一,除了各类让人眼花缭乱的新车,纷至沓来的各界行业大佬,也让车展话题度被不断拉高。在此之外,此次车展还刮起了一股“旋风”…

C++反汇编,指针和内存分配细节,面试题05

文章目录 20. 指针 vs 引用21. new vs malloc 20. 指针 vs 引用 指针是实体,占用内存空间,逻辑上独立;引用是别名,与变量共享内存空间,逻辑上不独立。指针定义时可以不初始化;引用定义时必须初始化。指针的…

通过MediaPipe+MiDaS实现人脸单目测距

MediaPipe:是Google开发的适用于直播和流媒体的开源、跨平台、可定制的机器学习解决方案。code地址:https://github.com/google/mediapipe ,最新发布版本v0.10.11,license为Apache-2.0。MediaPipe Solutions提供了一套库和工具&am…

【Linux网络】HTTPS【上】{运营商劫持/加密方式/数据摘要/https的诞生}

文章目录 1.引入1.1http与https1.2SSL/TLS1.3VPN1.4认识1.5密码学1.6为什么要加密?运营商 1.7常见的加密方式对称加密非对称加密 2.加密与解密3.数据摘要 && 数据指纹MD5 数字 签名理解三者数据摘要(Digital Digest):数字…

数据结构与算法之树和二叉树的一些概念和性质

目录 前言 一、树的定义 二、树的若干术语 1.结点的度 2.叶子 3.双亲与孩子 4.兄弟 5.祖先 6.树的度 7.结点的层次 8.树的深度 9.有序树和无序树 10.森林 三、树的逻辑结构 四、树的存储结构 1.顺序存储 2.链式存储 五、二叉树 1.定义 2.二叉树的五种状态 …

美食推荐网站设计

**中文摘要:**在当今信息化、网络化的时代背景下,美食文化正逐渐融入人们的日常生活,而网络平台成为人们获取美食信息、分享美食体验的重要途径。为了满足广大美食爱好者对美食信息的探索和推荐需求,本文提出了一种创新的美食推荐…

OS复习笔记ch5-3

引言 上一节我们学习了关于信号量机制的一些内容,包括信号量的含义,对应的PV操作等。 如图所示,上一节主要是针对信号量的互斥,其实信号量机制还可以做很多事情,比如实现进程同步和前驱关系,这一节我们先复…

Selenium 自动化 —— 常用的定位器(Locator)

什么是定位器 定位器(Locator)是识别DOM中一个或多个特定元素的方法。 也可以叫选择器 Selenium 通过By类,提供了常见的定位器。具体语法如下: By.xxx("");我们选择单个元素时可以使用findByElement: Web…

ICode国际青少年编程竞赛- Python-2级训练场-坐标与列表练习

ICode国际青少年编程竞赛- Python-2级训练场-坐标与列表练习 1、 for i in range(6):Spaceship.step(Item[i].x - Spaceship.x)Dev.step(Item[i].y - Dev.y)Dev.step(Spaceship.y - Dev.y)2、 for i in range(5):Spaceship.step(Item[i].x - Spaceship.x)Flyer[i].step(Item[…

【MySQL数据库开发设计规范】之基础规范

欢迎点开这篇文章,自我介绍一下哈,本人笔名姑苏老陈,是一个JAVA开发老兵。 本文收录于 《MySQL数据库开发设计规范》专栏中,该专栏主要分享一些关于MySQL数据库开发设计相关的技术规范文章,定期更新,欢迎关…

《ESP8266通信指南》11-Lua开发环境配置

往期 《ESP8266通信指南》10-MQTT通信(Arduino开发)-CSDN博客 《ESP8266通信指南》9-TCP通信(Arudino开发)-CSDN博客 《ESP8266通信指南》8-连接WIFI(Arduino开发)(非常简单)-CSD…

机器学习(三) ----------线性回归算法(梯度下降+正则化)

目录 1 定义 2 损失函数(回归) 2.1 最小二乘函数(Least Squares Function) 2.2 均方误差(Mean Squared Error, MSE) 2.3 均方根误差(Root Mean Squared Error, RMSE) 2.4 平均绝…

自动驾驶纵向控制算法

本文来源——b站忠厚老实的老王,链接:忠厚老实的老王投稿视频-忠厚老实的老王视频分享-哔哩哔哩视频 (bilibili.com),侵删。 功率和转速之间的关系就是:功率P等于转矩M乘以转速ω。并不是油门越大加速度就越大。 发动机和电机的转…

GDAL:Warning 1: All options related to creation ignored in update mode

01 警告说明 首先贴出相关代码: out_file_name Rs_{:4.0f}{:02.0f}.tiff.format(year, month) out_path os.path.join(out_dir, out_file_name) mem_driver gdal.GetDriverByName(MEM) mem_ds mem_driver.Create(, len(lon), len(lat), 1, gdal.GDT_Float32) …

掌握用户全生命周期数据,Xinstall让App投放更科学

在数字化时代,App已成为企业与用户互动的重要窗口。然而,想要让App在众多竞争者中脱颖而出,吸引并留住用户,有效的广告投放策略至关重要。这就需要对广告投放效果进行精准分析,以便及时调整策略,实现最大化…

Kubernetes的基本概念

目录 一.基本内容 1.定义 2.作用 二.特性 1.弹性伸缩 2.自我修复 3.服务发现和负载均衡 4.自动发布(默认滚动发布模式)和回滚 5.集中化配置管理和密钥管理 6.存储编排,支持外挂存储并对外挂存储资源进行编排 7.任务批处理运行 三…

clickhouse mergeTree表引擎解析

参照 https://clickhouse.com/docs/zh/engines/table-engines/mergetree-family/mergetree https://clickhouse.com/docs/en/optimize/skipping-indexes Clickhouse中最强大的表引擎当属MergeTree(合并树)引擎及该系列(*MergeTree&#xff…

Springboot项目使用redis实现session共享

1.安装redis,并配置密码 这里就不针对于redis的安装约配置进行说明了,直接在项目中使用。 redis在windows环境下安装:Window下Redis的安装和部署详细图文教程(Redis的安装和可视化工具的使用)_redis安装-CSDN博客 2…

图片公式识别@文档公式识别@表格识别@在线和离线OCR工具

文章目录 abstract普通文字识别本地软件识别公式扩展插件下载小结 在线识别网站/API👺Quicker整合(推荐)可视化编辑和识别公式其他多模态大模型识别图片中的公式排版 开源模型 abstract 本文介绍免费图片文本识别(OCR)工具,包括普通文字识别,公式识别,甚至是手写公…

Linux网络——自定义序列化与反序列化

前言 之前我们学习过socket之tcp通信,知道了使用tcp建立连接的一系列操作,并通过write与read函数能让客户端与服务端进行通信,但是tcp是面向字节流的,有可能我们write时只写入了部分数据,此时另一端就来read了&#x…