亚马逊推出有史以来最大的文本转语音模型

来源：要闻2024-05-16 10:35:06

导读亚马逊的研究人员推出了迄今为止最大的文本转语音模型，该模型将具有增强的质量，使其能够更好地表达复杂的句子。该模型BASETTS(文本转语音...

亚马逊的研究人员推出了迄今为止最大的文本转语音模型，该模型将具有增强的质量，使其能够更好地表达复杂的句子。

该模型BASETTS(文本转语音)代表具有紧急能力的大自适应流式TTS，可以为更加人性化的交互奠定基础。

根据这项研究，对TTS模型进行广泛的训练似乎可以提高可靠性和通用性，就像我们在人工智能中使用大型语言模型(LLM)时看到的那样。

文本转语音模型已经过公共领域100,000小时语音数据的训练，这使得该工具具有“最先进的自然度”。主要是英语，也使用一些德语、荷兰语和西班牙语数据。

此外，研究人员发现，即使使用10,000小时的语音训练TTS模型，也能提高更自然地表达复杂句子的能力。

BASE-large拥有9.8亿个参数，被认为是有史以来最大的文本转语音模型。该团队还训练了较小的模型，分别有4亿和1.5亿个参数以及10,000和1,000小时的语音，以便比较结果。

亚马逊团队将BASETTS描述为“能够通过几秒钟的参考音频模仿说话者特征的高保真模型”，他们认识到需要进行更多研究，但也承认其潜力。

研究人员关注的一些关键领域是复合名词、情感、外来词、副语言、标点符号、问题和句法复杂性——示例可以在专门的网页上找到。

随着革命性的人工智能成为2023年大部分时间的焦点，2024年类似的文本到语音的突破可能会继续将曾经的未来技术带到大众手中，但研究团队的谨慎态度确实凸显了在安全和隐私担忧。

关键词：

首页 > 要闻 > 正文

亚马逊推出有史以来最大的文本转语音模型

猜你喜欢

最新文章

点击排行

亚马逊推出有史以来最大的文本转语音模型

问界新M5在深开启规模交付发布72小时内大定突破1万台

上汽荣威发布“DMH超级混动技术”技术品牌

百亿基金业绩大反弹核心资产再领风骚

今日新聘基金经理5人，离任2人

大连电瓷拟与专业机构合作设立投资基金拓宽公司产业布局

公募基金加仓港股：结构性行情凸显，持续性待考

从15年前的一封基民来信，看基金圈的老兵与新高

南方基金深剖AI趋势探索由“智”提“质”内核

增持科技股！两大国际巨头，最新持仓曝光

热门文章

1970款福特都灵眼镜蛇54年来只有一位车主

研究探讨胚胎发育决策如何同时受多种途径控制

中信保诚嘉丰一年定开债发起式基金经理因工作安排由邢恭海更换为陈岚

迈富时首挂上市早盘高开3.21%

ETF融资余额连续5日减少，累计缩水12.08亿元

中信保诚稳瑞债券A、中信保诚稳瑞债券C增聘吴秋君为基金经理，基金经理邢恭海因工作安排离任

沙特主权财富基金PIF砸重金追风AI热潮! 大举买入ARM(ARM.US)看涨期权

又一家基金公司总经理，变更

逾千只股票被公募调研！机构关注这些赛道

北京基金小镇副总经理吴磊：凝聚各方投教合力更加有效保护投资者合法权益

首页 > 要闻 > 正文

亚马逊推出有史以来最大的文本转语音模型

猜你喜欢

最新文章

点击排行

亚马逊推出有史以来最大的文本转语音模型

问界新M5在深开启规模交付发布72小时内大定突破1万台

上汽荣威发布“DMH超级混动技术”技术品牌

百亿基金业绩大反弹 核心资产再领风骚

今日新聘基金经理5人，离任2人

大连电瓷拟与专业机构合作设立投资基金 拓宽公司产业布局

公募基金加仓港股：结构性行情凸显，持续性待考

从15年前的一封基民来信，看基金圈的老兵与新高

南方基金深剖AI趋势 探索由“智”提“质”内核

增持科技股！两大国际巨头，最新持仓曝光

热门文章

1970款福特都灵眼镜蛇54年来只有一位车主

研究探讨胚胎发育决策如何同时受多种途径控制

中信保诚嘉丰一年定开债发起式基金经理因工作安排由邢恭海更换为陈岚

迈富时首挂上市 早盘高开3.21%

ETF融资余额连续5日减少，累计缩水12.08亿元

中信保诚稳瑞债券A、中信保诚稳瑞债券C增聘吴秋君为基金经理，基金经理邢恭海因工作安排离任

沙特主权财富基金PIF砸重金追风AI热潮! 大举买入ARM(ARM.US)看涨期权

又一家基金公司总经理，变更

逾千只股票被公募调研！机构关注这些赛道

北京基金小镇副总经理吴磊：凝聚各方投教合力 更加有效保护投资者合法权益

百亿基金业绩大反弹核心资产再领风骚

大连电瓷拟与专业机构合作设立投资基金拓宽公司产业布局

南方基金深剖AI趋势探索由“智”提“质”内核

迈富时首挂上市早盘高开3.21%

北京基金小镇副总经理吴磊：凝聚各方投教合力更加有效保护投资者合法权益