share_log

OpenAI全面发布类人ChatGPT语音助手,会说中文等50多种语言

OpenAI全面發佈類人ChatGPT語音助手,會說中文等50多種語言

硬AI ·  09/25 09:08

來源:硬AI

ChatGPT 高級語音模式Advanced Voice本週面向ChatGPT Plus 和 Team 計劃的付費用戶推出,首先在美國上線,下週向Edu 和 Enterprise 計劃的訂閱者開放;新語音有自定義指令,新增五種聲音,撤走被指山寨「寡姐」的聲音,改進口音、提升對話速度和流暢度。

OpenAI首次公開發布四個月後,ChatGPT的類人高級人工智能(AI)語音助手功能終於開始面向廣大付費用戶。

美東時間9月24日週二,OpenAI宣佈,所有付費訂閱OpenAI ChatGPT Plus 和 Team 計劃的用戶都將可以使用新的 ChatGPT 高級語音模式Advanced Voice,該功能將在未來幾天內逐步推出,將首先在美國市場上線。下週,該功能將向OpenAI Edu 和 Enterprise 計劃的訂閱者開放。

這意味着,本週,ChatGPT的Plus 版個人用戶和 Teams 版小型企業團隊用戶都可以啓用新的語音功能,只需通過說話、無需手動輸入提示詞和GPT對話。在App上訪問高級語音模式時,用戶可以通過彈出窗口知道自己已經進入了高級語音助手,用戶會收到App的通知。

OpenAI賦予ChatGPT新語音版兩種功能,一是爲語音助手存儲「自定義指令」的功能,二是記住用戶希望語音助手錶現何種行爲的「記憶」功能,類似於今年4月OpenAI爲ChatGPT 文本版本推出的記憶功能。用戶可以利用這些功能確保語音模式的個性化,讓AI助手根據用戶對所有對話的偏好做出響應。

OpenAI本週二推出了五種不同風格的新聲音,分別名爲Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版語音模式推出的四種聲音 Breeze、Juniper、Cove 和 Ember,可選聲音達到九種,撤走了被指山寨「寡姐」的聲音Sky。OpenAI還提高了部分外語的對話速度、流暢度並改進口音。

OpenAI介紹,先進的語音助手可以用超過50種語言說「對不起,我遲到了」,並在社交媒體的發帖中附上一段視頻,演示用戶可以要求語音助手錶達,因爲讓奶奶等了很久,向奶奶致歉。視頻顯示,AI助手首先按照要求總結了用戶想要表達的意思,用英語說了一遍,而後,在用戶提示AI奶奶只會說普通話之後,AI助手又用標準的普通話說了一遍。

全新的語音功能適用於OpenAI的AI模型GPT-4o,不適用於最近發佈的預覽模型 o1。

此次新語音功能上線可謂姍姍來遲。華爾街見聞曾提到,今年5月OpenAI就在推出新旗艦模型GPT-4o時演示了語音模式Voice Mode。當時GPT-4o支持的ChatGPT聲音聽起來像一名美國成年女性,可以即時回應請求。當它聽到演示的OpenAI 研究主管 Mark Chen呼氣過度時,似乎從中察覺到了他的緊張,然後說他說「Mark,你不是吸塵器」,告訴Chen要放鬆呼吸。

OpenAI原計劃6月末向一小批Plus計劃用戶推出該語音模式,但6月宣佈推遲一個月發佈,以便確保該功能安全有效地處理來自數百萬用戶的請求。當時OpenAI稱,計劃今年秋季讓所有Plus用戶都可以訪問該功能,確切的時間表取決於是否達到內部對安全性和可靠性的高標準。

7月末,OpenAI對有限的部分付費Plus用戶推出高級語音模式下的ChatGPT,稱語音模式無法模仿他人的說話方式,且增加了新的過濾器,保證軟件能夠發現並拒絕某些生成音樂或其他形式受版權保護音頻的請求。不過,新的語音模式缺少5月OpenAI展示過的不少功能,比如計算機視覺功能。該功能可讓GPT僅通過使用智能手機的攝像頭就對用戶的舞蹈動作提供語音反饋。

編輯/lambor

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論