share_log

人工智能里程碑式应用,ChatGPT到底是什么?

人工智能里程碑式應用,ChatGPT到底是甚麼?

華爾街見聞 ·  2022/12/06 17:05

來源:華爾街見聞

AI繪畫的熱潮還沒散去,AI問答最近又迅速火了。

近期OpenAI發佈了全新的聊天機器人模型ChatGPT,沒想到一經上線,就因其高質量的回答、高效獲取信息的方式、以及上癮式的交互體驗而迅速出圈。

不少體驗過的人都驚呼,ChatGPT可能一舉消滅記者、程序員和搜索引擎。

就連馬斯克也忍不住發推表示,ChatGPT厲害得嚇人,我們距離危險而強大的AI不遠了。最近這個週末因沒有跟蹤ChatGPT新聞的「紐約時報」,甚至直接遭到了的馬斯克發推「奚落」。

圖:TED負責人Chris對紐約時報沒有報道ChatGPT表示震驚,馬斯克也在下面奚落紐約時報應該改名叫「社會正義時報」

用户數據上,上線還不到一週時間,12月5日OpenAI CEO就在推特上宣佈,ChatGPT已經達到了百萬用户。

什麼是ChatGPT?

ChatGPT是OpenAI發佈的聊天機器人模型,它的交互界面簡潔,只有一個輸入框,AI將根據輸入內容進行回覆,並允許在一個語境下持續聊天。

自從發佈以來,ChatGPT可謂出盡風頭,無論是讓它寫首押韻的詩、檢查代碼的bug、回答科學問題、對推特未來的發展提出建議……通通不在話下,它回覆的內容每次都是隨機的,但總體保持着一定的專業性和信息量,具備很強的參考意義。

比如,知識講解。

比如,寫小説。

目前已經有網友嘗試讓ChatGPT參加美國高考;寫小説;誘騙ChatGPT規劃如何毀滅世界;甚至讓ChatGPT扮演OpenAI,在系統內構建ChatGPT套娃。

為什麼這麼強大?

據浙商和國盛證券研報,ChatGPT相比以往的主要提升點在於記憶能力,ChatGPT可以儲存對話信息,延續上下文,從而實現連續對話,這在對話場景中至關重要,極大地提升了對話交互模式下的用户體驗。

具體而言,此次新加入的訓練方式被稱為「從人類反饋中強化學習」(ReinforcementLearning from Human Feedback,RLHF)。這一訓練方法增加了人類對模型輸出結果的演示,並且對結果進行了排序。具體操作上,人工智能訓練者扮演對話的雙方,即用户和人工智能助手,提供對話樣本。在人類扮演聊天機器人的時候,會讓模型生成一些建議輔助訓練師撰寫回復,訓練師會對回覆選項打分排名,將更好的結果輸回到模型中,通過以上獎勵策略對模型進行微調並持續迭代。

ChatGPT相比前輩模型還具有以下特徵:

1)可承認錯誤,若用户指出其錯誤,模型會聽取意見並優化答案。

2)可質疑不正確的前提,減少虛假描述,如被詢問「哥倫布2015年來到美國的情景」的問題時,機器人會説明哥倫布不屬於這一時代並調整輸出結果。

3)因ChatGPT採用了注重道德水平的訓練方式,ChatGPT在減少有害和不真實的回覆上改善顯著,如拒絕回答尋求霸凌他人方案的問題,指出其不正義性。

此外,ChatGPT的背後離不開大模型、大數據、大算力。

ChatGPT成為AIGC里程碑的背後,是算力發展和數字時代形成的大數據所共同支持的大模型訓練,才能實現目前的效果。由OpenAI研發的ChatGPT是微調後的GPT-3.5系列模型,有着多達1750億個模型參數,並在今年年初訓練完成。模型訓練的背後離不開大數據的支持,OpenAI主要使用的公共爬蟲數據集有着超過萬億單詞的人類語言數據集。在算力方面,GPT-3.5在Azure AI超算基礎設施(由V100GPU組成的高帶寬集羣)上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。

AIGC里程碑級應用

之前文章裏,我們給大家介紹了AIGC——人工智能自動生成內容,它當前主要用在文字、繪畫、圖像、視頻、音頻、遊戲以及虛擬人等。很明顯,AI問答ChatGPT都屬於AIGC的一個分支。

國盛證券表示,AIGC不僅改變創作,還將改變獲取信息的主要方式。而在此之上,ChatGPT所展示了作為生產力的存在,ChatGPT在尋找答案、解決問題的效率上已經部分的超越瞭如今的搜索引擎,ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式,AIGC有望成為數字經濟時代驅動需求爆發的殺手級應用。

市場空間方面,Gartner預計到2025年,生成式人工智能將佔所有生成數據的10%。根據《Generative AI:A Creative New World》的分析,AIGC有潛力產生數萬億美元的經濟價值。而國泰君安表示,未來五年或將有10%-30%的圖片內容由AI參與生成,相應或將有600億以上的市場規模。

相關行業

相比於此前的AI繪畫,ChatGPT更具有將AI能力與工作流程相結合的潛力。目前OpenAI等巨頭已着手自建計算集羣來滿足AIGC的要求,這種集中式的訓練對GPU、存儲、機房、供電等基礎設施均有巨大需求。國內部分創業團隊目前基於公有云訓練,隨着需求的增加,也有望轉向自建集羣。

國盛證券表示,今年以來,我國「東數西算」戰略自上而下快速推進,作為數字經濟的基礎,「算力即權力」,其重要性不言而喻,此前我們更多的互聯網應用聚焦於「存」而非「算」,隨着AIGC技術在全球的興起,「東數西算」的算力需求將越來越顯著。

公司方面,浙商證券表示,從下游相關受益應用來看,包括但不限於代碼機器人、小説衍生器、對話類搜索引擎、語伴、語音工作助手、對話虛擬人等。從上游增加需求來看,包括算力、數據標註、自然語言處理(NLP)等。

編輯/ roy

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論