谷歌發佈雙思維AI Agent：像人類一樣思考，重大技術突破！

AIGC開放社區 · 2024/11/29 08:29

来源：AIGC开放社区

正如《思考，快与慢》中提到的系统1和系统2那样，谷歌让AI具备“快”、“慢”两种拟人化思考方式，极大提升了效率。

今年10月，OpenAI高级研究科学家、德扑AI之父Noam Brown，曾在美国旧金山举办的TED AI大会上提出了一个惊人的理论——让AI模型思考20秒所带来的性能提升，相当于将模型扩大100,000倍并训练100,000倍的时间。

Noam所指的技术便是System 1/2 thinking，也是OpenAI最新模型o1正在使用的技术。

$谷歌-A (GOOGL.US)$ /$谷歌-C (GOOG.US)$ DeepMind研究人员则直接把这项技术集成到AI Agent中开发了Talker-Reasoner框架，让其具备“快”、“慢”两种拟人化思考方式。这对于解决复杂、冗长的任务来说帮助巨大，也突破了传统AI Agent执行业务流程的方法，极大提升了效率。

像人类一样思考——快、慢思维

在介绍谷歌的双思维AI Agent之前，「AIGC开放社区」先为大家简单介绍一下System 1/2的快、慢思维的由来和技术特性，对于理解Talker-Reasoner框架很有帮助。

快、慢思维最早是由诺贝尔经济学奖得主-丹尼尔·卡内曼在其著作《思考，快与慢》中提出，并被广泛接受为理解人类思维的一种重要理论框架。

这两种思维方式分别被称为“System1”和“System 2”，它们各自承担着不同的认知任务，并以独特的方式影响着我们的决策过程。

System 1，所谓的“快思考”，是一种自动化的、迅速的思维模式，几乎不需要消耗大量的认知资源，也不需要个体付出明显的努力。

当我们面对一个熟悉的场景或问题时，System1会迅速作出反应，提供即时的答案或解决方案。例如，当我们看到一辆车突然向我们驶来时，我们会本能地做出躲避的动作；或者当我们听到一个笑话时，我们可能会立即感到好笑并发出笑声。

这些反应都是System1在起作用的结果，它依赖于直觉和经验积累，能够在短时间内处理大量信息，但同时也可能因为缺乏深入分析而产生偏见或错误判断。

相比之下，System2则代表着“慢思考”，这是一种更为复杂和谨慎的思维过程。System2负责执行那些需要更多注意力和努力的任务，如解决复杂的数学问题、进行逻辑推理或是制定长期计划等。

如果你使用过OpenAI的o1或者国内的Deepseek、阿里最新开源的QwQ-32B模型，它们在执行超复杂问题时，便会进入短暂的思考时间。

System2的特点在于其能够对信息进行细致的分析和评估，从而得出更加准确和全面的结论。然而，由于这种思考方式需要消耗较多的认知资源，所以比System1要慢得多。

此外，在面对紧急情况或压力较大的情境下，System2的表现可能会受到影响，导致决策效率降低。

谷歌双思维AI Agent——Talker-Reasoner

而谷歌DeepMind研究人员提出的Talker-Reasoner中，巧妙地将System1/2集成到了AI Agent上。

Talker-Reasoner架构的核心思想是将AI Agent分为两个独立的模块：Talker和Reasoner。这两个模块分别对应于人类的System 1和System 2，各自承担着不同的任务和功能。

Talker模块，类似于System 1，负责快速、直观的对话生成，它能够迅速响应用户的需求，生成自然语言的回答。而Reasoner模块，类似于System 2，负责复杂的多步推理和规划，它需要更多的时间和计算资源来处理复杂的任务，如调用外部工具、检索信息和解决问题。

在Talker模块中，AI Agent被设计为能够理解和处理自然语言，生成连贯和自然的对话。这需要AI Agent具备强大的语言理解和生成能力，以及对上下文的敏感性。Talker模块需要能够快速地从记忆中提取相关信息，以支持其对话生成。

这种记忆可以是对话历史、用户偏好或其他相关信息。Talker模块的设计使其能够模拟人类的直觉反应，即使在信息不完全的情况下也能做出合理的回应。

与Talker模块的快速反应不同，Reasoner模块的设计重点在于深度思考和复杂问题解决。Reasoner模块需要能够执行多步推理，这可能涉及到对大量信息的分析和处理。它需要调用各种工具和数据库，以获取外部知识，支持其推理过程。

Reasoner模块还需要能够形成和更新关于用户状态的信仰，这些信仰以结构化语言对象的形式存储在记忆中。这种信仰建模是Reasoner模块的关键特征，它使得AI Agent能够更好地理解用户的需求和意图，从而提供更准确的服务。

在实际应用中，Talker和Reasoner模块之间的交互是通过记忆来实现的。Reasoner模块负责生成新的信仰状态，并将其存储在记忆中。Talker模块在需要时从记忆中检索这些信仰状态，以支持其对话生成。

这种设计允许Talker模块即使在Reasoner模块尚未完成其推理过程时，也能够继续与用户进行互动。该分工类似于人类的大脑，System 1始终活跃，而System 2则在需要时介入。

Talker-Reasoner测试数据

为了测试Talker-Reasoner的双思维性能，研究人员用这个开发了一个睡眠辅导Agent。在这个场景中，AI Agent需要与用户进行对话，提供关于改善睡眠习惯的建议和计划。

Talker模块负责与用户的直接互动，而Reasoner模块则负责制定和调整睡眠辅导计划。这种分工使得AI Agent能够同时进行快速的对话和复杂的规划，提高了用户体验。

在测试中，Talker模块通过一系列指令编码专家知识，指导其完成睡眠辅导的各个阶段。这些指令不仅包括了与用户互动的规则，还包括了睡眠辅导的具体步骤和策略。Talker模块需要能够理解和回应用户的需求，同时保持对话的连贯性和自然性。

Reasoner模块则需要根据用户的反馈和需求，调整和优化睡眠辅导计划。这可能涉及到调用外部资源，如睡眠相关的研究和建议，以及根据用户的具体情况制定个性化的计划。Reasoner模块的设计使其能够处理复杂的逻辑和推理，为用户提供最合适的建议。

在实际对话中，Talker和Reasoner模块的协同工作被证明是有效的。Talker模块能够流畅地与用户对话，而Reasoner模块则能够根据用户的反馈调整和优化辅导计划。这种分工执行使得AI Agent能够同时处理快速的对话和复杂的规划，极大提高了用户体验。

论文地址：https://arxiv.org/abs/2410.08328v1

编辑/jayden

來源：AIGC開放社區

正如《思考，快與慢》中提到的系統1和系統2那樣，谷歌讓AI具備「快」、「慢」兩種擬人化思考方式，極大提升了效率。

今年10月，OpenAI高級研究科學家、德撲AI之父Noam Brown，曾在美國舊金山舉辦的TED AI大會上提出了一個驚人的理論——讓AI模型思考20秒所帶來的性能提升，相當於將模型擴大100,000倍並訓練100,000倍的時間。

Noam所指的技術便是System 1/2 thinking，也是OpenAI最新模型o1正在使用的技術。

$谷歌-A (GOOGL.US)$ /$谷歌-C (GOOG.US)$ DeepMind研究人員則直接把這項技術集成到AI Agent中開發了Talker-Reasoner框架，讓其具備「快」、「慢」兩種擬人化思考方式。這對於解決複雜、冗長的任務來說幫助巨大，也突破了傳統AI Agent執行業務流程的方法，極大提升了效率。

像人類一樣思考——快、慢思維

在介紹谷歌的雙思維AI Agent之前，「AIGC開放社區」先爲大家簡單介紹一下System 1/2的快、慢思維的由來和技術特性，對於理解Talker-Reasoner框架很有幫助。

快、慢思維最早是由諾貝爾經濟學獎得主-丹尼爾·卡內曼在其著作《思考，快與慢》中提出，並被廣泛接受爲理解人類思維的一種重要理論框架。

這兩種思維方式分別被稱爲「System1」和「System 2」，它們各自承擔着不同的認知任務，並以獨特的方式影響着我們的決策過程。

System 1，所謂的「快思考」，是一種自動化的、迅速的思維模式，幾乎不需要消耗大量的認知資源，也不需要個體付出明顯的努力。

當我們面對一個熟悉的場景或問題時，System1會迅速作出反應，提供即時的答案或解決方案。例如，當我們看到一輛車突然向我們駛來時，我們會本能地做出躲避的動作；或者當我們聽到一個笑話時，我們可能會立即感到好笑併發出笑聲。

這些反應都是System1在起作用的結果，它依賴於直覺和經驗積累，能夠在短時間內處理大量信息，但同時也可能因爲缺乏深入分析而產生偏見或錯誤判斷。

相比之下，System2則代表着「慢思考」，這是一種更爲複雜和謹慎的思維過程。System2負責執行那些需要更多注意力和努力的任務，如解決複雜的數學問題、進行邏輯推理或是制定長期計劃等。

如果你使用過OpenAI的o1或者國內的Deepseek、阿里最新開源的QwQ-32B模型，它們在執行超複雜問題時，便會進入短暫的思考時間。

System2的特點在於其能夠對信息進行細緻的分析和評估，從而得出更加準確和全面的結論。然而，由於這種思考方式需要消耗較多的認知資源，所以比System1要慢得多。

此外，在面對緊急情況或壓力較大的情境下，System2的表現可能會受到影響，導致決策效率降低。

谷歌雙思維AI Agent——Talker-Reasoner

而谷歌DeepMind研究人員提出的Talker-Reasoner中，巧妙地將System1/2集成到了AI Agent上。

Talker-Reasoner架構的核心思想是將AI Agent分爲兩個獨立的模塊：Talker和Reasoner。這兩個模塊分別對應於人類的System 1和System 2，各自承擔着不同的任務和功能。

Talker模塊，類似於System 1，負責快速、直觀的對話生成，它能夠迅速響應用戶的需求，生成自然語言的回答。而Reasoner模塊，類似於System 2，負責複雜的多步推理和規劃，它需要更多的時間和計算資源來處理複雜的任務，如調用外部工具、檢索信息和解決問題。

在Talker模塊中，AI Agent被設計爲能夠理解和處理自然語言，生成連貫和自然的對話。這需要AI Agent具備強大的語言理解和生成能力，以及對上下文的敏感性。Talker模塊需要能夠快速地從記憶中提取相關信息，以支持其對話生成。

這種記憶可以是對話歷史、用戶偏好或其他相關信息。Talker模塊的設計使其能夠模擬人類的直覺反應，即使在信息不完全的情況下也能做出合理的回應。

與Talker模塊的快速反應不同，Reasoner模塊的設計重點在於深度思考和複雜問題解決。Reasoner模塊需要能夠執行多步推理，這可能涉及到對大量信息的分析和處理。它需要調用各種工具和數據庫，以獲取外部知識，支持其推理過程。

Reasoner模塊還需要能夠形成和更新關於用戶狀態的信仰，這些信仰以結構化語言對象的形式存儲在記憶中。這種信仰建模是Reasoner模塊的關鍵特徵，它使得AI Agent能夠更好地理解用戶的需求和意圖，從而提供更準確的服務。

在實際應用中，Talker和Reasoner模塊之間的交互是通過記憶來實現的。Reasoner模塊負責生成新的信仰狀態，並將其存儲在記憶中。Talker模塊在需要時從記憶中檢索這些信仰狀態，以支持其對話生成。

這種設計允許Talker模塊即使在Reasoner模塊尚未完成其推理過程時，也能夠繼續與用戶進行互動。該分工類似於人類的大腦，System 1始終活躍，而System 2則在需要時介入。

Talker-Reasoner測試數據

爲了測試Talker-Reasoner的雙思維性能，研究人員用這個開發了一個睡眠輔導Agent。在這個場景中，AI Agent需要與用戶進行對話，提供關於改善睡眠習慣的建議和計劃。

Talker模塊負責與用戶的直接互動，而Reasoner模塊則負責制定和調整睡眠輔導計劃。這種分工使得AI Agent能夠同時進行快速的對話和複雜的規劃，提高了用戶體驗。

在測試中，Talker模塊通過一系列指令編碼專家知識，指導其完成睡眠輔導的各個階段。這些指令不僅包括了與用戶互動的規則，還包括了睡眠輔導的具體步驟和策略。Talker模塊需要能夠理解和回應用戶的需求，同時保持對話的連貫性和自然性。

Reasoner模塊則需要根據用戶的反饋和需求，調整和優化睡眠輔導計劃。這可能涉及到調用外部資源，如睡眠相關的研究和建議，以及根據用戶的具體情況制定個性化的計劃。Reasoner模塊的設計使其能夠處理複雜的邏輯和推理，爲用戶提供最合適的建議。

在實際對話中，Talker和Reasoner模塊的協同工作被證明是有效的。Talker模塊能夠流暢地與用戶對話，而Reasoner模塊則能夠根據用戶的反饋調整和優化輔導計劃。這種分工執行使得AI Agent能夠同時處理快速的對話和複雜的規劃，極大提高了用戶體驗。

論文地址：https://arxiv.org/abs/2410.08328v1

編輯/jayden

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

谷歌发布双思维AI Agent：像人类一样思考，重大技术突破！