追蹤AI最新趨勢

專題 723條資訊 13283人訂閱

人工智能里程碑式應用，ChatGPT到底是甚麼？

華爾街見聞 · 2022/12/06 17:05

来源：华尔街见闻

AI绘画的热潮还没散去，AI问答最近又迅速火了。

近期OpenAI发布了全新的聊天机器人模型ChatGPT，没想到一经上线，就因其高质量的回答、高效获取信息的方式、以及上瘾式的交互体验而迅速出圈。

不少体验过的人都惊呼，ChatGPT可能一举消灭记者、程序员和搜索引擎。

就连马斯克也忍不住发推表示，ChatGPT厉害得吓人，我们距离危险而强大的AI不远了。最近这个周末因没有跟踪ChatGPT新闻的「纽约时报」，甚至直接遭到了的马斯克发推「奚落」。

图：TED负责人Chris对纽约时报没有报道ChatGPT表示震惊，马斯克也在下面奚落纽约时报应该改名叫「社会正义时报」

用户数据上，上线还不到一周时间，12月5日OpenAI CEO就在推特上宣布，ChatGPT已经达到了百万用户。

什么是ChatGPT？

ChatGPT是OpenAI发布的聊天机器人模型，它的交互界面简洁，只有一个输入框，AI将根据输入内容进行回复，并允许在一个语境下持续聊天。

自从发布以来，ChatGPT可谓出尽风头，无论是让它写首押韵的诗、检查代码的bug、回答科学问题、对推特未来的发展提出建议……通通不在话下，它回复的内容每次都是随机的，但总体保持着一定的专业性和信息量，具备很强的参考意义。

比如，知识讲解。

比如，写小说。

目前已经有网友尝试让ChatGPT参加美国高考；写小说；诱骗ChatGPT规划如何毁灭世界；甚至让ChatGPT扮演OpenAI，在系统内构建ChatGPT套娃。

为什么这么强大？

据浙商和国盛证券研报，ChatGPT相比以往的主要提升点在于记忆能力，ChatGPT可以储存对话信息，延续上下文，从而实现连续对话，这在对话场景中至关重要，极大地提升了对话交互模式下的用户体验。

具体而言，此次新加入的训练方式被称为「从人类反馈中强化学习」（ReinforcementLearning from Human Feedback，RLHF）。这一训练方法增加了人类对模型输出结果的演示，并且对结果进行了排序。具体操作上，人工智能训练者扮演对话的双方，即用户和人工智能助手，提供对话样本。在人类扮演聊天机器人的时候，会让模型生成一些建议辅助训练师撰写回复，训练师会对回复选项打分排名，将更好的结果输回到模型中，通过以上奖励策略对模型进行微调并持续迭代。

ChatGPT相比前辈模型还具有以下特征：

1）可承认错误，若用户指出其错误，模型会听取意见并优化答案。

2）可质疑不正确的前提，减少虚假描述，如被询问「哥伦布2015年来到美国的情景」的问题时，机器人会说明哥伦布不属于这一时代并调整输出结果。

3）因ChatGPT采用了注重道德水平的训练方式，ChatGPT在减少有害和不真实的回复上改善显著，如拒绝回答寻求霸凌他人方案的问题，指出其不正义性。

此外，ChatGPT的背后离不开大模型、大数据、大算力。

ChatGPT成为AIGC里程碑的背后，是算力发展和数字时代形成的大数据所共同支持的大模型训练，才能实现目前的效果。由OpenAI研发的ChatGPT是微调后的GPT-3.5系列模型，有着多达1750亿个模型参数，并在今年年初训练完成。模型训练的背后离不开大数据的支持，OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面，GPT-3.5在Azure AI超算基础设施（由V100GPU组成的高带宽集群）上进行训练，总算力消耗约3640PF-days（即每秒一千万亿次计算，运行3640个整日）。

AIGC里程碑级应用

之前文章里，我们给大家介绍了AIGC——人工智能自动生成内容，它当前主要用在文字、绘画、图像、视频、音频、游戏以及虚拟人等。很明显，AI问答ChatGPT都属于AIGC的一个分支。

国盛证券表示，AIGC不仅改变创作，还将改变获取信息的主要方式。而在此之上，ChatGPT所展示了作为生产力的存在，ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎，ChatGPT或许在未来会改变我们获取信息、输出内容的方式，AIGC有望成为数字经济时代驱动需求爆发的杀手级应用。

市场空间方面，Gartner预计到2025年，生成式人工智能将占所有生成数据的10%。根据《Generative AI：A Creative New World》的分析，AIGC有潜力产生数万亿美元的经济价值。而国泰君安表示，未来五年或将有10%-30%的图片内容由AI参与生成，相应或将有600亿以上的市场规模。

什麼是ChatGPT？

ChatGPT是OpenAI發佈的聊天機器人模型，它的交互界面簡潔，只有一個輸入框，AI將根據輸入內容進行回覆，並允許在一個語境下持續聊天。

自從發佈以來，ChatGPT可謂出盡風頭，無論是讓它寫首押韻的詩、檢查代碼的bug、回答科學問題、對推特未來的發展提出建議……通通不在話下，它回覆的內容每次都是隨機的，但總體保持着一定的專業性和信息量，具備很強的參考意義。

比如，知識講解。

比如，寫小説。

目前已經有網友嘗試讓ChatGPT參加美國高考；寫小説；誘騙ChatGPT規劃如何毀滅世界；甚至讓ChatGPT扮演OpenAI，在系統內構建ChatGPT套娃。

為什麼這麼強大？

據浙商和國盛證券研報，ChatGPT相比以往的主要提升點在於記憶能力，ChatGPT可以儲存對話信息，延續上下文，從而實現連續對話，這在對話場景中至關重要，極大地提升了對話交互模式下的用户體驗。

具體而言，此次新加入的訓練方式被稱為「從人類反饋中強化學習」（ReinforcementLearning from Human Feedback，RLHF）。這一訓練方法增加了人類對模型輸出結果的演示，並且對結果進行了排序。具體操作上，人工智能訓練者扮演對話的雙方，即用户和人工智能助手，提供對話樣本。在人類扮演聊天機器人的時候，會讓模型生成一些建議輔助訓練師撰寫回復，訓練師會對回覆選項打分排名，將更好的結果輸回到模型中，通過以上獎勵策略對模型進行微調並持續迭代。

ChatGPT相比前輩模型還具有以下特徵：

1）可承認錯誤，若用户指出其錯誤，模型會聽取意見並優化答案。

2）可質疑不正確的前提，減少虛假描述，如被詢問「哥倫布2015年來到美國的情景」的問題時，機器人會説明哥倫布不屬於這一時代並調整輸出結果。

3）因ChatGPT採用了注重道德水平的訓練方式，ChatGPT在減少有害和不真實的回覆上改善顯著，如拒絕回答尋求霸凌他人方案的問題，指出其不正義性。

此外，ChatGPT的背後離不開大模型、大數據、大算力。

ChatGPT成為AIGC里程碑的背後，是算力發展和數字時代形成的大數據所共同支持的大模型訓練，才能實現目前的效果。由OpenAI研發的ChatGPT是微調後的GPT-3.5系列模型，有着多達1750億個模型參數，並在今年年初訓練完成。模型訓練的背後離不開大數據的支持，OpenAI主要使用的公共爬蟲數據集有着超過萬億單詞的人類語言數據集。在算力方面，GPT-3.5在Azure AI超算基礎設施（由V100GPU組成的高帶寬集羣）上進行訓練，總算力消耗約3640PF-days（即每秒一千萬億次計算，運行3640個整日）。

AIGC里程碑級應用

之前文章裏，我們給大家介紹了AIGC——人工智能自動生成內容，它當前主要用在文字、繪畫、圖像、視頻、音頻、遊戲以及虛擬人等。很明顯，AI問答ChatGPT都屬於AIGC的一個分支。

國盛證券表示，AIGC不僅改變創作，還將改變獲取信息的主要方式。而在此之上，ChatGPT所展示了作為生產力的存在，ChatGPT在尋找答案、解決問題的效率上已經部分的超越瞭如今的搜索引擎，ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式，AIGC有望成為數字經濟時代驅動需求爆發的殺手級應用。

市場空間方面，Gartner預計到2025年，生成式人工智能將佔所有生成數據的10%。根據《Generative AI：A Creative New World》的分析，AIGC有潛力產生數萬億美元的經濟價值。而國泰君安表示，未來五年或將有10%-30%的圖片內容由AI參與生成，相應或將有600億以上的市場規模。

追蹤AI最新趨勢

人工智能里程碑式应用，ChatGPT到底是什么？

人工智能里程碑式應用，ChatGPT到底是甚麼？

什么是ChatGPT？

为什么这么强大？

AIGC里程碑级应用

相关行业

什麼是ChatGPT？

為什麼這麼強大？

AIGC里程碑級應用

相關行業

追蹤AI最新趨勢

人工智能里程碑式应用，ChatGPT到底是什么？

人工智能里程碑式應用，ChatGPT到底是甚麼？

什么是ChatGPT？

为什么这么强大？

AIGC里程碑级应用

相关行业

什麼是ChatGPT？

為什麼這麼強大？

AIGC里程碑級應用

相關行業

風險及免責聲明

聲明