來源:AIGC開放社區
正如《思考,快與慢》中提到的系統1和系統2那樣,谷歌讓AI具備「快」、「慢」兩種擬人化思考方式,極大提升了效率。
今年10月,OpenAI高級研究科學家、德撲AI之父Noam Brown,曾在美國舊金山舉辦的TED AI大會上提出了一個驚人的理論——讓AI模型思考20秒所帶來的性能提升,相當於將模型擴大100,000倍並訓練100,000倍的時間。
Noam所指的技術便是System 1/2 thinking,也是OpenAI最新模型o1正在使用的技術。
$谷歌-A (GOOGL.US)$ /$谷歌-C (GOOG.US)$ DeepMind研究人員則直接把這項技術集成到AI Agent中開發了Talker-Reasoner框架,讓其具備「快」、「慢」兩種擬人化思考方式。這對於解決複雜、冗長的任務來說幫助巨大,也突破了傳統AI Agent執行業務流程的方法,極大提升了效率。

像人類一樣思考——快、慢思維
在介紹谷歌的雙思維AI Agent之前,「AIGC開放社區」先爲大家簡單介紹一下System 1/2的快、慢思維的由來和技術特性,對於理解Talker-Reasoner框架很有幫助。
快、慢思維最早是由諾貝爾經濟學獎得主-丹尼爾·卡內曼在其著作《思考,快與慢》中提出,並被廣泛接受爲理解人類思維的一種重要理論框架。
這兩種思維方式分別被稱爲「System1」和「System 2」,它們各自承擔着不同的認知任務,並以獨特的方式影響着我們的決策過程。

System 1,所謂的「快思考」,是一種自動化的、迅速的思維模式,幾乎不需要消耗大量的認知資源,也不需要個體付出明顯的努力。
當我們面對一個熟悉的場景或問題時,System1會迅速作出反應,提供即時的答案或解決方案。例如,當我們看到一輛車突然向我們駛來時,我們會本能地做出躲避的動作;或者當我們聽到一個笑話時,我們可能會立即感到好笑併發出笑聲。
這些反應都是System1在起作用的結果,它依賴於直覺和經驗積累,能夠在短時間內處理大量信息,但同時也可能因爲缺乏深入分析而產生偏見或錯誤判斷。
相比之下,System2則代表着「慢思考」,這是一種更爲複雜和謹慎的思維過程。System2負責執行那些需要更多注意力和努力的任務,如解決複雜的數學問題、進行邏輯推理或是制定長期計劃等。
如果你使用過OpenAI的o1或者國內的Deepseek、阿里最新開源的QwQ-32B模型,它們在執行超複雜問題時,便會進入短暫的思考時間。
System2的特點在於其能夠對信息進行細緻的分析和評估,從而得出更加準確和全面的結論。然而,由於這種思考方式需要消耗較多的認知資源,所以比System1要慢得多。
此外,在面對緊急情況或壓力較大的情境下,System2的表現可能會受到影響,導致決策效率降低。
谷歌雙思維AI Agent——Talker-Reasoner
而谷歌DeepMind研究人員提出的Talker-Reasoner中,巧妙地將System1/2集成到了AI Agent上。
Talker-Reasoner架構的核心思想是將AI Agent分爲兩個獨立的模塊:Talker和Reasoner。這兩個模塊分別對應於人類的System 1和System 2,各自承擔着不同的任務和功能。

Talker模塊,類似於System 1,負責快速、直觀的對話生成,它能夠迅速響應用戶的需求,生成自然語言的回答。而Reasoner模塊,類似於System 2,負責複雜的多步推理和規劃,它需要更多的時間和計算資源來處理複雜的任務,如調用外部工具、檢索信息和解決問題。
在Talker模塊中,AI Agent被設計爲能夠理解和處理自然語言,生成連貫和自然的對話。這需要AI Agent具備強大的語言理解和生成能力,以及對上下文的敏感性。Talker模塊需要能夠快速地從記憶中提取相關信息,以支持其對話生成。
這種記憶可以是對話歷史、用戶偏好或其他相關信息。Talker模塊的設計使其能夠模擬人類的直覺反應,即使在信息不完全的情況下也能做出合理的回應。
與Talker模塊的快速反應不同,Reasoner模塊的設計重點在於深度思考和複雜問題解決。Reasoner模塊需要能夠執行多步推理,這可能涉及到對大量信息的分析和處理。它需要調用各種工具和數據庫,以獲取外部知識,支持其推理過程。

Reasoner模塊還需要能夠形成和更新關於用戶狀態的信仰,這些信仰以結構化語言對象的形式存儲在記憶中。這種信仰建模是Reasoner模塊的關鍵特徵,它使得AI Agent能夠更好地理解用戶的需求和意圖,從而提供更準確的服務。
在實際應用中,Talker和Reasoner模塊之間的交互是通過記憶來實現的。Reasoner模塊負責生成新的信仰狀態,並將其存儲在記憶中。Talker模塊在需要時從記憶中檢索這些信仰狀態,以支持其對話生成。
這種設計允許Talker模塊即使在Reasoner模塊尚未完成其推理過程時,也能夠繼續與用戶進行互動。該分工類似於人類的大腦,System 1始終活躍,而System 2則在需要時介入。
Talker-Reasoner測試數據
爲了測試Talker-Reasoner的雙思維性能,研究人員用這個開發了一個睡眠輔導Agent。在這個場景中,AI Agent需要與用戶進行對話,提供關於改善睡眠習慣的建議和計劃。
Talker模塊負責與用戶的直接互動,而Reasoner模塊則負責制定和調整睡眠輔導計劃。這種分工使得AI Agent能夠同時進行快速的對話和複雜的規劃,提高了用戶體驗。
在測試中,Talker模塊通過一系列指令編碼專家知識,指導其完成睡眠輔導的各個階段。這些指令不僅包括了與用戶互動的規則,還包括了睡眠輔導的具體步驟和策略。Talker模塊需要能夠理解和回應用戶的需求,同時保持對話的連貫性和自然性。

Reasoner模塊則需要根據用戶的反饋和需求,調整和優化睡眠輔導計劃。這可能涉及到調用外部資源,如睡眠相關的研究和建議,以及根據用戶的具體情況制定個性化的計劃。Reasoner模塊的設計使其能夠處理複雜的邏輯和推理,爲用戶提供最合適的建議。
在實際對話中,Talker和Reasoner模塊的協同工作被證明是有效的。Talker模塊能夠流暢地與用戶對話,而Reasoner模塊則能夠根據用戶的反饋調整和優化輔導計劃。這種分工執行使得AI Agent能夠同時處理快速的對話和複雜的規劃,極大提高了用戶體驗。
編輯/jayden