
微软 Azure Neural TTS新增了五种声音模型(神经网络版文本转语音),让我们再次体会到风格迁移技术 AI 强有力的支持语音模型多情感多风格。
芯片采购网专注于整合国内外授权IC代理商现货资源,芯片库存实时查询,行业价格合理,采购方便IC芯片,国内专业芯片采购平台。
更新的五种美式英语声音模型包括青春甜美 Jane、低沉温和的 Nancy、随意而精力充沛 Davis、响亮激昂的 Jason 沙哑粗犷 Tony。在风格迁移技术的支持下,我们不仅快乐 (cheerful)、伤心 (sad)、生气 (angry)、兴奋 (excited)、期待 (hopeful)、友好 (friendly)、不友好 (unfriendly) 和恐惧 (terrified) 等待丰富的情感表现,还有第一次使用的呼喊 (shouting) 和耳语 (whispering) 两种表达方式。到目前为止,用户已经达到了可选的美国英语声音模型 20 丰富的情感和风格使应用场景更加多样化。
风格迁移技术的原理是将一个声音模型的节奏和语调复制到另一个声音模型上,使后者在音色不变的前提下也能有前者的节奏和语调。过去,声音风格的构建主要依靠录音演员录制各种风格的声音数据,然后使用录音数据生成多种风格的智能语音模型,但录音演员很难解释所有风格的声音。风格迁移技术创新地解决了这个问题,可以有效地给予更多 AI 情感和风格的声音。
声音风格和声音情感模型的不断更新,使 Azure Neural TTS 合成语音已广泛应用于各种商业场景中,让用户感受到更现实的语音体验。例如,游戏平台可以快速为角色产生各种情感声音,为游戏增加更个性化的情节表达,使虚拟游戏世界栩栩如生。State of Decay”(腐烂国NDK代理)创作者 —— 微软亡灵工作室 (Undead Labs) 它的使命是为游戏创造一个新的方向,它们应用于游戏开发 Azure Neural TTS。推出包括推出Psychonauts 二、精神病患者 2)多种游戏,包括多种游戏 Double Fine 工作室也在使用 Azure Neural TTS 制作未来游戏项目的原型。音频解决方案提供商 Remixd 集成在其平台中 Azure Neural TTS 的声音模型 Jenny 和 Davis,让客户在创建音频内容时有更多的选择。
关于 Azure Neural TTS
微软 Azure Neural TTS 是 Azure 开发人员可以使用认知服务中强大的语音合成功能 AI 技术将文本转化为逼真的声音。到目前为止,微软 Azure Neural TTS 支持全球 140 提供国家和地区的语言 400 声音模型可以加速声音的自动化生产,帮助各种企业更快地培养满足业务场景的声音,打造专属的声音品牌 —— 无论是呼叫中心、语音助手、有声书制作、聊天机器人、语音导购,还是影视剧 / 动画配音、自媒体短视频、情感电台、教育培训等场景。
持续的技术迭代和版本更新,让 Azure Neural TTS 它能为更多的企业和场景提供逼真、自然、脚踏实地的声音体验。同时,微软的所有技术进步都接受微软的责任 AI 流程指导遵循公平、包容、可靠、安全、透明、隐私、安全、负责任的原则,通过微软负责人工智能办公室 (ORA),人工智能、伦理与工程研究委员会 (Aether),以及负责任 AI 战略管理团队 (RAISE) 监督和实施这些道德标准。
- 士兰明镓SiC第一条电源器件生产线初步通线SiC设备芯片投片成功
- 美光:增强现实,虚拟现实,走向超现实
- 据说英伟达 RTX 40 系列 GPU 以台积电为基础 4nm 打造
- 巴西航空工业(ERJ.US):供应链混乱或无法实现年度交付目标
- IAR Systems赋能Alif Semiconductor在微控制器和集成处理器中创建强大的人工智能/机器学习应用
- 俄罗斯警告断气,提高半导体生产成本,全球芯片行业应恐慌
- 高品质锂电池是年轻用户的新选择FAR远征锂电池实力出圈
- 九个海外就业锦囊
- 由于涉嫌违反应用内支付法,韩国计划调查苹果和谷歌
- 全志科技:V853 视觉处理芯片已进入正式量产阶段 ARM、RISC-V、NPU 三核异构设计
- Pixelworks逐点半导体赋能一加Ace显示屏凡屏幕显示性能显示性能
- 马斯克:今年或宣布第五个超级工厂计划 最0到12家工厂最终建成
