ChatGPT最新功能“Text To Speech (TTS,文本转语音)”详细解读!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024谷歌一起变强。

ChatGPT灰度推送Text To Speech (TTS)功能

尽管OpenAI早就发布了Text To Speech (TTS)模型,但对于ChatGPT网页版来说,还一直没有应用这个模型,也就是ChatGPT本身并不具备直接的文本到语音(TTS)转换功能。这意味着ChatGPT无法直接将生成的文本回复转换成语音输出。我们需要阅读屏幕上的文字回复,而不是听到它们被朗读出来。尽管ChatGPT移动端app已经集成了语音对话的功能,但对于正常的文本回复是无法转换为语音输出的。

今天(2024年3月3日),ChatGPT网页版和app端均已开始灰度推送Text To Speech (TTS)功能。检查你的账号有没有被灰度推送到的方法就是在ChatGPT网页或者app端,点击右下角账号-进入设置页面,已经开通了Text To Speech (TTS)功能的账号会出现Speech这个选项,如下图所示。

同时,在正常的聊天页面,在每条文本对话的左下角会出现一个语音的小标志,点击后可以听到默认声音对本条文本信息的播放。

Text To Speech (TTS)功能描述

Text To Speech (TTS) 功能是一种将书面文字转换为可听见的语音的技术。它允许用户通过语音输出来接收信息,而不是传统的视觉阅读。这项技术使得文本内容更加易于输出,特别是在用户需要双手操作、视觉疲劳或偏好听觉学习时。OpenAI发布的TTS模型能提供多种语言和声音选项,可以根据用户的偏好进行调整,从而提供个性化的听觉体验。

对于ChatGPT来说,Text To Speech(TTS)功能意味着ChatGPT不仅能以文字形式提供信息和回答问题,还能够通过语音输出,用户将能够享受到更加丰富的交互体验。

核心特点

  1. 自然语音输出:利用语音合成技术,TTS功能能够产生接近真人发音的语音,包括语调、停顿和情感的细微变化,使得听起来更加自然和流畅。

  2. 多语言支持:支持多种语言和口音,使得用户可以选择适合自己母语或偏好的语音输出,对于外语学习者来说是一个很实用的功能。

  3. 个性化设置:用户可以根据个人需求调整语声音模型,使语音输出更符合个人偏好。

声音模型

目前ChatGPT支持5种声音模型,可以按照个人喜好按需选择。

支持的语言

TTS模型通常在语言支持方面遵循Whisper模型。尽管当前的语音优化为英语,但Whisper支持以下语言并表现良好:

南非荷兰语,阿拉伯语,亚美尼亚语,阿塞拜疆语,白俄罗斯语,波斯尼亚语,保加利亚语,加泰罗尼亚语,中文,克罗地亚语,捷克语,丹麦语,荷兰语,英语,爱沙尼亚语,芬兰语,法语,加利西亚语,德语,希腊语,希伯来语,印地语,匈牙利语,冰岛语,印尼语,意大利语,日语,卡纳达语,哈萨克语,韩语,拉脱维亚语,立陶宛语,马其顿语,马来语,马拉地语,毛利语,尼泊尔语,挪威语,波斯语,波兰语,葡萄牙语,罗马尼亚语,俄语,塞尔维亚语,斯洛伐克语,斯洛文尼亚语,西班牙语,斯瓦希里语,瑞典语,他加禄语,泰米尔语,泰语,土耳其语,乌克兰语,乌尔都语,越南语和威尔士语。

移动端app如何使用TTS功能

在ChatGPT app中,可以长按文本对话,选择Listen即可播放这条文本。

OpenAI Text To Speech (TTS)相关链接

  1. Text to speech官方文档:https://platform.openai.com/docs/guides/text-to-speech

  2. TTS模型介绍:https://platform.openai.com/docs/models/tts


精选推荐

  1. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  2. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  3. 字节开发的Coze进阶使用:用免费的GPT4打造一个专属的新闻播报机器人!附教程及提示词Prompt

  4. 盘点那些免费的AI对话工具(国内篇):国内TOP3 AI聊天机器人产品介绍

  5. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(一)

  6. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(二)

  7. 人工智能时代的领跑者:你必须了解的全球三大AI聊天机器人!

  8. 抖音出的AI工具火了!自动生成抖音文案,一键脚本数字人成片!

  9. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!

  10. 腾讯AI虽迟但到:腾讯文档AI开启公测!附申请地址及详细教程!


都读到这里了,点个赞鼓励一下吧😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/426794.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Windows环境MySQL全量备份+增量备份

一、环境准备 1.1.安装MySQL 在进行MySQL数据库备份和还原操作时,必须先提前安装好MySQL环境,且MySQL服务已成功开启 如果没有安装MySQL环境,可以参考博客:http://t.csdnimg.cn/h8bHl 如果已成功安装MySQL环境,打开…

Orbit 使用指南 02 | 在场景中生成原始对象| Isaac Sim | Omniverse

如是我闻: Orbit使用指南02将 深入探讨如何使用Python代码在Orbit中向场景生成各种对象(或原始对象)。一起探索如何生成地面平面、灯光、基本图形形状以及来自USD文件的网格。前置知识:如何生成空白场景,Orbit 使用指…

VUE实现Office文档在线编辑,支持doc/docx、xls/xlsx、ppt/pptx、pdf等

1.微软提供的在线Office预览(只能预览,不能编辑) https://view.officeapps.live.com/op/view.aspx?src服务器上文档地址(http开头) 2.国内在线Office方案: 腾讯文档、石墨文档、飞书 优势:跨…

paimon取消hive转filesystem

目录 概述实践关键配置spark sql 结束 概述 公司上一版本保留了 hive ,此版优化升级后,取消 hive。 实践 关键配置 同步数据时,配置如下,将形成两个库 # ods库 CREATE CATALOG paimon WITH (type paimon,warehouse hdfs:///d…

CentOS配网报错:network is unreachable

常用命令: 打开: cd /etc/sysconfig/network-scripts/ 修改: vim ifcfg-ens33 打开修改: vim /etc/sysconfig/network-scripts/ifcfg-ens33 保存: 方法1:ESCZZ(Z要大写) 方…

熔断降级 spring事务

如果有事务处理,会先把事务的自动提交给关闭

Apache Flink连载(三十七):Flink基于Kubernetes部署(7)-Kubernetes 集群搭建-3

🏡 个人主页:IT贫道-CSDN博客 🚩 私聊博主:私聊博主加WX好友,获取更多资料哦~ 🔔 博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频 目录

32单片机基础:PWM驱动舵机,直流电机

PWM驱动舵机 接线图如上图所示。注意,舵机的5V 线不能接到面包板上的正极,面包板上的正极只有3.3V,是STM32提供的,所以要接到STLINK的5V, 我们如何驱动舵机呢?由之前我们介绍原理知道,要输出如下图对应的PWM波形才行…

202209 青少年软件编程等级考试Scratch二级真题

第 1 题 【 单选题 】 数字:1,2,3,4,6,9,13,19,28,...的下一项是多少? A:37 B:39 C:41 D:47 …

爱奇艺2023年营收319亿元:完善服务价值感知,重构影视新生态

近日,爱奇艺(NASDAQ:IQ)发布截至2023年12月31日未经审计的第四季度和全年财报,这份财报被外界评价为“爱奇艺交出的年度最佳业绩”。 财报显示,爱奇艺全年总营收319亿元,同比增长10%;非美国通用…

模拟器抓HTTP/S的包时如何绕过单向证书校验(XP框架)

模拟器抓HTTP/S的包时如何绕过单向证书校验(XP框架) 逍遥模拟器无法激活XP框架来绕过单向的证书校验,如下图: ​​ 解决办法: 安装JustMePlush.apk安装Just Trust Me.apk安装RE管理器.apk安装Xposedinstaller_逍遥64位…

Java SE:反射

反射作用 获取字节码文件里面的所有信息,包括构造方法、成员、成员方法,以及修饰他们的修饰符、类型和方法的返回值等等,只要是类里面的内容都能获取,获取之后可以动态的调用方法,动态的创建对象 获取类字节码文件对象…

vue3中的基本语法

目录 基础素材 vue3的优化 使用CompositionAPI理由 1. reactive() 函数 2. ref() 函数 2.1. ref的使用 2.2. 在 reactive 对象中访问 ref 创建的响应式数据 3. isRef() 函数 4. toRefs() 函数 5. computed() 5.1. 通过 set()、get()方法创建一个可读可写的计算属性 …

“耳机党”注意了!你的耳机,用对了吗?

文章目录 📖 介绍 📖🏡 什么是“3个60”原则? 🏡📒 如何遵循“3个60”原则? 📒📝 控制音量📝 适时休息📝 关注外界声音 📖 介绍 &…

深度学习目标检测】二十二、基于深度学习的肺炎检测系统-含数据集、GUI和源码(python,yolov8)

肺炎尽管很常见,但准确诊断是一项困难的任务。它要求训练有素的专家对胸部X光片进行检查,并通过临床病史,生命体征和实验室检查进行确认。肺炎通常表现为胸部X光片上一个或多个区域的阴影(opacity)增加。但是,由于肺部有许多其他状…

足球青训俱乐部|基于Springboot的足球青训俱乐部管理系统设计与实现(源码+数据库+文档)

足球青训俱乐部管理系统目录 目录 基于Springboot的足球青训俱乐部管理系统设计与实现 一、前言 二、系统设计 1、系统架构设计 三、系统功能设计 1、管理员登录界面 2、公告信息管理界面 3、学员管理界面 4、商品信息管理界面 5、课程安排管理界面 四、数据库设计…

机器学习:主成分分析笔记

主成分分析(Principal Component Analysis,PCA)是一种无监督的机器学习算法,通常用于高维数据的降维、提取主要特征、数据降噪和可视化。PCA的基本思想是将原始数据的多个变量转换为少数几个相互独立的变量(即主成分&a…

上海亚商投顾:深成指震荡涨超1% 两市成交连续破万亿

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 沪指3月1日震荡反弹,深成指、创业板指午后涨超1%。充电桩概念股集体走强,英可瑞、欧陆…

Stable Video文本生成视频公测地址——Scaling Latent Video Diffusion Models to Large Datasets

近期,Stability AI发布了首个开放视频模型——"Stable Video",该创新工具能够将文本和图像输入转化为生动的场景,将概念转换成动态影像,生成出电影级别的作品,旨在满足广泛的视频应用需求,包括媒…

leetcode10正则表达式匹配

leetcode10正则表达式匹配 思路python 思路 难点1 如何理解特殊字符 ’ * ’ 的作用? 如何正确的利用特殊字符 ’ . ’ 和 ’ * ’ ? * 匹配零个或多个前面的那一个元素 "a*" 可表示的字符为不同数目的 a,包括: "…
最新文章