字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
AIGC动态欢迎阅读
原标题:字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
关键字:语音,模型,字节跳动,说话,团队
文章来源:机器之心
内容字数:0字
内容摘要:
机器之心报道
编辑:Panda通过高保真合成语音与真人语音无异。
首先来听一段《凡人修仙传》:你猜的没错,这段有声书并非来自某个专业制作团队,而是一个 AI 模型 Seed-TTS,而这个模型则是来自字节跳动的 Seed Team。
TTS 是指文本转语音,这是一种具备诸多妙用的技术,像是让个人智能助理说话、为视频或游戏配音、辅助视障人士、制作有声书等等。对于 TTS 技术研发者来说,流畅自然的表达一直以来都是值得追求的重要目标。
字节跳动 Seed Team 发布的 Seed-TTS 不只是一个模型,而是一整个模型系列。论文标题:Seed-TTS: A Family of High-Quality Versatile Speech Generation Models
论文地址:https://arxiv.org/pdf/2406.02430
演示网站:https://bytedancespeech.github.io/seedtts_tech_report/
据介绍,该系列模型有能力合成自然度和表现力达到人类水平的语音。不仅如此,Seed-TTS 还能以零样本方式基于一段较短的录入语
原文链接:字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
联系作者
文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台
© 版权声明 文章版权归作者所有,未经允许请勿转载。