文字转语音TTS在线使用经验

文字转语音TTS在线使用经验

文字转语音TTS在线使用经验


2024-04-15 ,今天测试了一下微软 Azure TTS 的新语音引擎,主要测试了英语和中文。

这次 MicroSoft 一共推出了 9 款包括:
美式英语 - en-US-AvaMultilingualNeural 女性
美式英语 - en-US-AndrewMultilingualNeural 男性
美式英语 - en-US-EmmaMultilingualNeural 年轻女性
美式英语 - en-US-BrianMultilingualNeural
德语 - De-DE-FlorianMultilingualNeural
德语 - De-DE-SeraphinaMultilingualNeural
法语 - Fr-FR-RemyMultilingualNeural
法语 - Fr-FR-VivienneMultilingualNeural
中文 - zh-CN-XiaoxiaoMultiligualNeural 。

更多官方消息来源:https://learn.microsoft.com/en-gb/azure/ai-services/speech-service/index-text-to-speech。

很可惜,中文只推出了一个女性的声音。效果可以说是非常好,长时间听也不会有“机械式发音”的那种让人方案的情绪。

我转换了大约 30 多分钟的中文文字音频,觉得其他的语音角色都不需要再选择了,用只用 zh-CN-XiaoxiaoMultiligualNeural 就可以了。

周末花了一点时间把最新版的 TTS 效果集成到了一个在线的工具中:

网址:  jcjc.CuoBieZi.net/sitemap/audio/tts

TTS 文本转语音效果截图

我用下面的文字做测试:

如果你在山里经常走捷径,很可能走着走着就会发现没路可走了。
很多时候捷径走着走着就走成了绝路、死路,你不得不重新折返,归零重来。
最关键的是找到一条能长期积累的路。

试听的效果如下:

jcjc-tts-2024_04_15T14_22_49

(视频正在审核中。)

00:30未知来源

这是一段长达 30 秒的视频,听起来的效果,耳朵很舒服,没有那种机械、生硬和维和的感觉。

如果对语音有更高的品质要求,就需要使用MSTTS 的 SSML 语音合成的方法了。下一步准备把:多音字的支持、音色、音调的支持也集成进来。

目前默认的输出格式是:“audio-16khz-32kbitrate-mono-mp3” ,为了节省空间,选择了几乎是效果较差的一个标准。效果最好的是:44.1kHz 标准的,比如:“audio-48khz-192kbitrate-mono-mp3”。

这里有一份权威的参考:

https://learn.microsoft.com/en-us/javascript/api/microsoft-cognitiveservices-speech-sdk/speechsynthesisoutputformat?view=azure-node-latest

文本转语音,如果是文章、短文类的阅读,效果的提升、自定义比较容易实现。如果是小说中人物的对话,这里面感觉有很多可以优化的点。

准备下一篇文章详细聊一下这方面的改进工作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/548042.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Java基础学习】面向对象编程

开始时间: April 10, 2024 结束时间: April 16, 2024 阶段: Done 基础部分 类与对象的关系 类是抽象的,概念的,代表一类事物对象是具体的,实际的,代表一个具体事物(实例)类是对象的模板,对象…

基于Springboot+Vue的Java项目-校园管理系统(附演示视频+源码+LW)

大家好!我是程序员一帆,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:Java毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &am…

mysql,oracle,sql server中的默认事务隔离级别查看

一 、事务 一个事务中的一系列的处理操作要么全部成功,要么全部失败。在数据库操作中,一项事务(Transaction)是由一条或多条操作数据库的SQL语句组成的一个不可分割的工作单元。 事务的处理结果有两种: 1)当…

使用AI动作捕捉制作动画图像——Viggle AI教程

使用AI动作捕捉制作动画图像——Viggle AI教程 在数字媒体时代,动画制作已经成为一种流行的艺术形式。最近,我在网上发现了一个非常有趣的AI动画制作工具——Viggle AI。这个工具不仅简单易用,而且目前还是免费的。在这篇博客中,我…

DHCP小实验

实验要求: 看拓扑有两个网段则我们首先需要对200.1.1.0/26进行子网划分,划分为两个子网,为200.1.1.0/27和200.1.1.32/27 我门就可以一边一个网段了,左边为200.1.1.0/27,右边为200.1.1.32/27 1、配置PC1,2…

腾讯EdgeOne产品测评体验——不仅仅是加速,更是您数字安全的坚实盾牌!

EdgeOne 是什么--- 下一代CDN 腾讯云推出的边缘安全加速平台 EO(Tencent cloud EdgeOne,下文简称为 EdgeOne) 是基于腾讯边缘计算节点提供加速和安全的解决方案。即对标传统的 CDN 网络分发节点,但是其在加速和安全防护的方面有更…

从建表语句带你学习doris_表索引

1、doris建表概述 1.1、doris建表模板 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [DATABASE.]table_name (column_definition1[,column_deinition2,......][,index_definition1,[,index_definition2,]] ) [ENGINE [olap|mysql|broker|hive]] [key_desc] [COMMENT "tabl…

无人零售行业展望:智能化与便利性引领未来

无人零售行业展望:智能化与便利性引领未来 无人零售,这一依靠智能化技术如人工智能、物联网、和大数据的零售模式,正逐步成为全球零售行业的新趋势。该模式允许消费者在没有店员的情况下自助完成购物,提供了24小时服务&#xff0…

Redis集群机制及一个Redis架构演进实例

Replication(主从复制) Redis的replication机制允许slave从master那里通过网络传输拷贝到完整的数据备份,从而达到主从机制。为了实现主从复制,我们准备三个redis服务,依次命名为master,slave1&#xff0c…

季节更迭 关爱不变 | 鲁南制药四季守护您的健康生活

春天,万物复苏的季节,一切都充满了生机和活力。在春日的阳光下,鲜花盛开,绿叶茂盛,鸟儿欢歌,蝴蝶翩翩起舞。我们的身体也需要特别的关爱和养护,保持健康和活力,更好地迎接每一次季节…

MySQL 实例employee表综合查询

目录 表关系图: 例题: 1.查出至少有一个员工的部门。显示部门编号、部门名称、部门位置、部门人数。 2.列出所有员工的姓名及其直接上级的姓名。 3.列出受雇日期早于直接上级的所有员工的编号、姓名、部门名称。 4.列出部门名称和这些部门的员工信…

正五边形C语言绘制方法

正五边形C语言绘制方法 平面几何大家都学过,基本的概念就是点、线、面,三角形、矩形、圆形和椭圆形,还有就是多边形。学几何时都强调用圆规直尺三角板作图,学到角度就用到量角尺。那时我对五角星,六角星很感兴趣。后来…

【攻防世界】lottery

弱比较代码审计 本题已提供源码,如果没提供,输入/robots.txt,发现/.git function buy($req){require_registered();require_min_money(2);$money $_SESSION[money];//接受用户原有money$numbers $req[numbers];//接受输入的数字$win_num…

生产者消费者模型之环形队列

引入 以电影院买票为例 去电影院看电影需要先买票,如果买过票了,哪怕我们没有去看电影,在电影票的有效期内,电影院对应的座位就是属于你的。 买票的本质:对资源(座位)的预订。 信号量 本质…

【VUE】Vue项目打包报告生成:让性能优化触手可及

Vue项目打包报告生成:让性能优化触手可及 Vue.js是一款流行的前端框架,开发者在使用Vue.js构建项目时,生产环境的性能优化尤为重要。为了帮助开发者分析和优化打包出来的资源,生成打包报告是一个不可或缺的步骤。本文将介绍几种在…

光纤收发器的注意事项

光纤收发器有各种不同的类别,而实际使用中最受关注的是根据光纤收发器的不同类别:SC连接器光纤收发器和FC/ST连接器光纤收发器。 当使用光纤收发器连接到不同的设备时,必须小心使用不同的端口。 1.光纤收发器与100Base TX设备(交…

RAKsmart:硅谷裸机云多IP服务器性能评测

在云计算领域,裸机云作为一种结合了传统物理服务器与云计算优势的服务模式,近年来备受关注。硅谷裸机云作为业界佼佼者,以其出色的性能和稳定性赢得了众多用户的青睐。今天,我们就来评测一下硅谷裸机云的多IP服务器性能。 首先&am…

JVM基础第二篇

目录 垃圾回收 如何判断对象可以回收 引用计数法 可达性分析算法 定义 哪些对象可以作为GC roots? 四种引用 1.强引用 2.软引用(SoftReference) 3. 弱引用(WeakReference) 4. 虚引用(PhantomRefe…

OpenHarmony轻量系统开发【6】驱动之ADC按键

摘要:本文简单介绍如何操作ADC去读取电压,并且实现开发板上3个ADC按键检测的功能 适合群体:适用于润和Hi3861开发板,L0轻量系统驱动开发 文中所有代码仓库:https://gitee.com/qidiyun/hihope-3861-smart-home-kit 6…

FL Studio v21.2.3.4004 中文永久版网盘下载(含Key.reg注册表补丁)

软件介绍 FL Studio21水果编曲软件汉化版是一款专业的音乐制作软件,被广泛地应用于电子音乐、hip-hop、流行乐等多种音乐类型的制作。该软件提供了丰富的音频编曲工具和音乐效果器,让用户可以轻松地创作出高品质的音乐作品。同时,这也是一款…
最新文章