微软公布全新TTS语音模型,实现自然语音交互
【HowToTech科技】9月22日消息,生成式人工智能(AI)正风靡全球,与AI进行聊天的用户对文本转语音的自然性和表现力提出了更高的要求。为满足这一需求,微软今天宣布推出了四款全新的TTS(Text-to-Speech)语音模型,分别是en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNerual和zh-CN-YunjieNeural,目前已在美国东部、东南亚和西欧三个市场提供公共预览版。
据HowToTech科技了解,这四款TTS语音模型旨在为用户提供更加自然的语音交互体验,使聊天过程更加贴近现实、更加自然,更具吸引力。这意味着在与AI进行对话时,用户将能够听到更加流畅、自然和富有情感的语音输出。
微软在新闻稿中展示了这四款TTS语音模型的对比效果,并演示了它们在不同语气风格下的表现。这些演示可通过提供的链接进行深入体验。
此外,微软还提到开发者可以利用Azure Speech SDK和REST
API,将这些先进的语音模型集成到他们现有的应用程序中。这为开发者提供了机会,利用这些语音模型来增强他们应用程序中的语音交互功能,从而创建更智能、更人性化的语音助手、虚拟角色和其他语音应用程序。这一举措将推动语音技术在各个领域的应用和创新,为用户带来更出色的体验。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...