人工智能技术发展迅速,比如美颜、人工智能、自动驾驶等等,都应用在生活的各个方面。至于“语音合成TTS”,其实用性已经让人惊叹。
像百度云等都推出了文本转语音在线服务API,但合成的人声往往容易听出“机械感”,不过微软Azure TTS文本转语音服务的效果还是相当惊艳的!它拥有多种声音和情绪风格,可以像真人一样读出语调,让合成的人声非常逼真自然。一起来看看吧...
Microsoft 自然语音转换 - 像真人一样大声朗读文本并将其保存为音频
Azure Text to Speech 是一款可以将文本转换为像真人一样的自然语音的云服务。与同类 TTS 相比,它更强大的地方在于利用 AI 神经网络技术,让合成的语音拥有媲美真人的表现。它能够将人声的语调与情绪进行匹配文本语音合成软件,朗读时可以表达出快乐、悲伤、新闻播报、客服、恐惧、低语等情绪。
此外,语速、语调、发音、停顿都可以由用户调整,实际生成的声音非常自然逼真!听起来一点都不像机器人的声音!因此,微软的文本转语音技术几乎可以应用于任何场景。朗读功能就是基于此的。可惜的是,这项服务是收费的文本语音合成软件,而且需要懂编程才能使用,距离普通用户似乎还很遥远?
别担心!其实微软提供了免费的在线DEMO演示,可以让用户输入文字在线试听(但字数有限制,而且试听无法保存)。于是,专家们就大显神通,为我们带来了 Microsoft Speech Synthesis Assistant、Edge-TTS-record、Microsoft TTS Download Button script Plugin 等几款免费工具,可以帮助你将一大段文字转换成音频并导出成mp3或者录制成wav保存起来以备不时之需。
↓输入原文获取下载地址↓
「下载地址在原文末尾绿框处」
微软TTS朗读效果预览:
我们来听几段微软的文本转语音效果,相信大家听得出来比目前大多数的TTS好太多了,情绪表达简直完美!不同的场景可以采用不同的语调,比如开心、严肃,甚至讲鬼故事也能传达出恐惧的感觉。
其实微博、抖音、快手很多视频的配音都是用这个微软语音库生成的,人声听起来非常自然,如果不特别注意,基本听不出是机器合成的。
Microsoft 语音合成助手免费版(Windows)
“微软语音合成助手”是一款完全免费的Windows PC文本转语音软件,绿色免安装,体积小巧,打开即可使用(需要网络连接),软件界面简洁,可以立即使用。
它完全使用微软的 Azure TTS 服务来合成文本并生成语音,支持在线试听,还可以保存为 mp3 音频文件,效果非常接近真人朗读!不仅真实自然,还可以设置它的情绪风格、语速、停顿、音量等等。
微软语音合成助手可以支持导入TXT、SRT字幕、PDF等多种格式的文档文件,甚至可以支持JPG、PNG截图中的文字识别并导入到文本内容中。而且重点是这款软件采用分段下载合并的方式,这种方式解决了一次只能转换2500个单词的问题。
软件支持编辑内容的保存和导出,支持翻译、自动排版、自动标点、文字替换、敏感词提醒、敏感词替换、SSML多人混音等功能,还可以实现批量转换。
浏览器插件:Microsoft TTS下载音频按钮(Treasure Monkey script)
上面提到,微软TTS本身提供了网页版的文本转语音在线演示,可以让用户在浏览器中输入或粘贴文本,转换成语音进行试听,但官网并没有提供下载功能。笔者制作了一个“微软TTS下载音频按钮”插件,可以让你将试听的语音下载并保存为MP3音频。
这款浏览器插件完全免费,以 Userscript 的形式提供,例如在 Edge 等浏览器中安装 Tempermonkey 插件后,就可以安装该类脚本,如果安装成功并启用,Microsoft TTS 网页除了预览按钮外,还会多出一个“下载音频”按钮,如上图所示。
所以,如果你使用Mac、Linux或者不想下载第三方软件,你也可以使用此脚本在浏览器中将文本转换为音频。
Edge-TTS-record开源录音工具
这款开源免费的“edge-TTS-record”工具是一款可以录制文本转语音(TTS)并输出为.wav音频的Windows版本工具。另外,还有一款名为“Read Aloud by asup”的工具与这款程序功能几乎相同,但不知道是否是同一作者编写的。
由于Edge浏览器也采用了微软Azure TTS技术,因此拥有同样逼真自然的语音引擎,包括笑笑、云阳等角色的配音,不过相比前两者,这款工具的实现方式需要将试听声音“录制”,因此录制时间较长,且过程中可能会受到系统中其他软件的声音影响。
aspeak-命令行文本转语音工具:
对于有特殊需求的朋友,还有命令行版本的微软TTS语音合成工具aspeak,这是一个基于Azure语音合成用Python编写的命令行程序,安装简单,可跨平台使用。
#安装
aspeakpip install --upgrade aspeak#最简单的例子:aspeak -t "异次元软件世界,你好呀!" -l zh-CN
#导入 .txt 文件,并转换成 .wav 音频保存
aspeak -f input.txt -l zh-CN -o ouput.wav
更多具体的参数,比如如何指定语音等,可以参考aspeak的官方文档,至于这个工具的实际应用例子,就看你的想象力和二次开发能力了。
总结:
无论你是视频UP主、自媒体还是办公族,借助微软Azure TTS语音合成引擎,你不仅可以录制一些旁白、阅读电子书、为视频配音等,还可以自娱自乐,为生活和工作带来便捷和乐趣。
以上工具全部免费,有兴趣有需要的朋友可以下载使用。当然微软的TTS云服务接口本来就是需要付费的,这些免费工具都是基于微软免费Demo演示而开发的。但如果哪天关闭了,可能就用不了了。所以免费是有限的,请用好用好珍惜……
↓输入原文获取下载地址↓
「下载地址在原文末尾绿框处」
不同维度网站: