share_log

OpenAI发布高级语音功能:支持普通话等50多种语言

新浪科技 ·  Sep 25 15:40

北京时间9月25日,OpenAI宣布,正在向ChatGPT的更多付费用户推出“高级语音模式”(AVM)。该语音功能将使ChatGPT的对话更加自然,最初将向ChatGPT Plus和Teams用户推出,而企业和教育用户将于下周开始获得访问权限。

作为新功能推出的一部分,AVM的设计也得到了改善。该功能现在由蓝色动画球体来代表,而不是OpenAI在五月份展示该技术时展示的动画黑点。

当向用户提供AVM时,ChatGPT应用程序中的语音图标旁边将收到一个弹出窗口。ChatGPT还推出了五种新声音供用户尝试:Arbor、Maple、Sol、Spruce和Vale。这使得ChatGPT的声音总数达到九个,几乎与Google的Gemini Live一样多。

需要指出的是,之前展示的酷似斯嘉丽·约翰逊(Scarlett Johansson)声音的“Sky”却消失不见。包括之前的四种声音:Breeze、Juniper、Cove和Ember,所有这些名称的灵感都来自大自然,这可能是因为AVM的目的就是让使用ChatGPT感觉更自然。

OpenAI表示,ChatGPT的语音功能现在更擅长理解口音,其对话也更流畅、更迅速。OpenAI表示,AVM支持用50多种语言说“对不起,我迟到了”。在OpenAI给出的一段视频演示中,AVM可以使用普通话流利、自然地向他人道歉。

OpenAI还将ChatGPT的一些自定义功能扩展到AVM:自定义指令(允许用户个性化ChatGPT响应的方式)和内存(允许ChatGPT记住对话以供稍后参考)。

OpenAI发言人表示,AVM尚未在多个地区提供,包括欧盟、英国、瑞士、冰岛、挪威和列支敦士登。

OpenAI于今年5月宣布了这一新功能,并在过去的数月中进行了完善和优化。OpenAI联合创始人兼CEO萨姆·奥特曼(Sam Altman)周二在社交平台X上称:“希望大家能感觉到等待是值得的。”

分析人士称,AVM的这一新进展标志着在改善对话式AI的语音交互方面迈出了重要的一步。这一新进展表明,OpenAI继续为更流畅的交互铺平道路。

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment