推广 热搜: 行业  设备    系统  参数  经纪    教师  机械  中国 

语音合成(speech synthesis)方向四:开源中文和英文训练语料库open speech corpus

   日期:2024-11-10     作者:n19v1    caijiyuan   评论:0    移动:http://fswenzheng.xhstdz.com/mobile/news/4438.html
核心提示:声明:工作以来主要从事TTS工作,工程算法都有涉及,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。平时搜集

声明:工作以来主要从事TTS工作,工程算法都有涉及,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表 低调奋进 TTS 开源数据 低调奋进。如转载,请标明出处。

                                                                               欢迎关注微信公众号:低调奋进


目录

语音合成(speech synthesis)方向四:开源中文和英文训练语料库open speech corpus

1   标贝

2  希尔贝壳

3  DiDiSpeech

4  LJ speech Dataset

5  VCTK

6  LibriTTS

7  CSS10

8 Hi-Fi TTS


语音合成系统的训练需要大量高质量精标语料库,这给很多研究人员带来诸多不便。本篇文章主旨为整理目前开源的语音语料,便于相关从业者使用。首先,我们需要为这些为开源数据做贡献的个人、公司或者组织表达敬意,有了这些开源的数据,才能促进语音合成的发展。

我把个人搜集的语音合成、语音识别和噪声数据整理到个人的网站,有兴趣的研究者可以搜藏  低调奋进

本文章对开源的语音合成数据的选取的标准:音频的质量较高,语料库包含音频和对应的标注信息文件。


     标贝(北京)科技有限公司(简称“标贝科技”)是一家专注智能语音交互和AI数据服务的人工智能公司,为AI领域提供各种高质量的训练语料和技术方案。标贝开源了一万句的女生音库,详细信息如下:

数据内容:中文标准女声语音库数据

录音语料:综合语料样本量;音节音子的数量、类型、音调、音连以及韵律等进行覆盖。

有效时长:约12小时

平均字数:16字

语言类型:标准普通话

发音人:女;20-30岁;声音积极知性

录音环境:声音采集环境为专业录音棚环境:1)录音棚符合专业音库录制标准;2)录音环境和设备自始至终保持不变;3)录音环境的信噪比不低于35dB。

录制工具:专业录音设备及录音软件

本文地址:http://fswenzheng.xhstdz.com/news/4438.html    物流园资讯网 http://fswenzheng.xhstdz.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类最新文章
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新文章
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号