AI迎來轉折點：谷歌Gemini 2.0會成爲自主AI的開始嗎？

新浪科技 · 12/12 08:08

北京时间12月12日晚间消息，谷歌今日发布了新一代AI大模型Gemini 2.0，标志着向能够独立完成复杂任务的AI系统迈出了雄心勃勃的一步。同时，Gemini 2.0还引入了原生图像生成和多语言音频功能，使得谷歌在日益激烈的AI竞争中与OpenAI和Anthropic展开直接竞争。

新版本的发布正值谷歌首次推出Gemini的一年后，也正处于AI开发的关键时刻。这些新的“代理”AI系统不仅可以响应查询，还可以理解微妙的上下文，提前规划多个步骤，并代表用户采取受监督行动。

谷歌的新AI助手将如何重塑日常数字生活？

在最近的一次新闻发布会上，Gemini产品管理总监Tulsee Doshi概述了该系统的增强功能，同时展示了实时图像生成和多语言对话。Doshi解释说：“Gemini 2.0带来了增强的性能和新的功能，如原生图像和多语言音频生成。它还具有原生智能工具的使用，这意味着它可以直接访问谷歌产品，如搜索，甚至执行代码。”

最初的版本以Gemini 2.0 Flash为中心，这是一个实验版本，谷歌声称其运行速度是其前身的两倍，同时超越了一些强大模型的功能。这代表着一项重大的技术成就，因为之前的速度提升通常是以降低功能为代价的。

走进新一代AI代理

也许最重要的是，谷歌推出了三个基于Gemini 2.0架构的原型AI代理，展示了该公司对AI未来的愿景。Project Astra是一款升级后的通用AI助手，展示了它在访问谷歌工具和维护先前交互的上下文记忆的同时，能够跨多种语言保持复杂对话的能力。

谷歌DeepMind团队产品经理Bibo Xu在现场演示中解释说：“Project Astra现在有长达10分钟的会话记忆，可以记住你过去与它的对话，这样你就可以获得更有用、更个性化的体验。”

该系统可以在各语言之间平稳过渡，并通过谷歌搜索和地图访问实时信息，显示出了以前在消费者AI产品中看不到的整合水平。

企业AI之战愈演愈烈

对于开发人员和企业客户，谷歌推出了Project Mariner和Jules，这两款专门的AI代理旨在自动化复杂的技术任务。作为Chrome扩展程序演示的Project Mariner，在WebVoyager基准测试中实现了令人印象深刻的83.5%的成功率，这比之前的自主Web导航尝试有了显著改进。该WebVoyager基准主要测试代理在端到端、真实世界的Web任务上的性能。

Google Labs产品管理总监Jaclyn Konzelmann表示：“ Project Mariner是一个早期的研究原型，它探索了浏览网页和采取行动的代理能力。当使用WebVoyager基准进行评估时，Project Mariner取得了83.5%的令人印象深刻的成功率。”

定制硅：谷歌AI雄心背后的基础设施

支持这些进步的是Trillium，谷歌的第六代Tensor Processing Unit （TPU），如今已普遍可供云客户使用。定制的AI加速器代表了对计算基础设施的巨大投资，谷歌在单个网络结构中部署了超过10万个Trillium芯片。

谷歌AI工作室和Gemini API团队的产品经理Logan Kilpatrick在新闻发布会上强调了这项基础设施投资的实际影响。Kilpatrick说：“闪存使用量的增长超过了900%，这令人难以置信。你知道，在过去的几个月里，我们已经推出了六个实验模型，现在有数百万开发人员在使用Gemini。”

未来之路：自主AI时代的安全问题和竞争

谷歌向自主代理的转变，可能是自OpenAI发布ChatGPT以来AI领域最重要的战略转折点。虽然竞争对手一直专注于增强大型语言模型的能力，但谷歌认为，未来属于能够主动导航数字环境、并在最少的人为干预下完成复杂任务的AI系统。

这种能够思考、计划和行动的AI代理的愿景，代表着与当前响应式AI助理模式的背离。这是一个有风险的赌注，因为自主系统可能带来更大的安全问题和技术挑战。但如果成功，它可能会重塑竞争格局。谷歌在定制硅和基础设施方面的大规模投资表明，该公司准备在这个新方向上积极竞争。

然而，向更自主的AI系统的过渡引发了新的安全和伦理问题。谷歌强调了其对负责任开发的承诺，包括与值得信赖的用户进行广泛的测试和内置的安全措施。谷歌还逐步推出这些功能的方法，从开发人员访问和值得信赖的测试人员开始，表明了对部署自主AI系统所涉及的潜在风险的认识。

此次Gemini 2.0的发布正值谷歌面临竞争对手日益增加的压力和对AI安全的严格审查的关键时刻。微软和OpenAI今年在AI开发方面取得了重大进展，而Anthropic等其他公司也在企业客户中获得了吸引力。

谷歌Gemini API集团产品经理Shrestha Basu Mallick在新闻发布会上强调：“我们坚信，构建AI的唯一方法是从一开始就负责任。随着我们推进模型和代理，我们将继续优先考虑将安全和责任作为模型开发过程的关键要素。”

随着这些系统在现实世界中采取行动的能力越来越强，它们可以从根本上重塑人们与技术的互动方式。Gemini 2.0的成功不仅可以决定谷歌在AI市场的地位，还可以决定随着行业向更自主的系统发展，AI发展的更广泛轨迹。

一年前，当谷歌推出Gemini的第一个版本时，AI领域主要由聊天机器人主导，这些机器人可以进行聪明的对话，但在现实世界的任务中却举步维艰。现在，随着AI代理开始朝着自主性迈出第一步，该行业正处于另一个转折点。问题不再是AI是否能理解我们，而是我们是否准备好让AI代表我们行事。谷歌正在押注，而且赌注很大。

北京時間12月12日晚間消息，谷歌今日發佈了新一代AI大模型Gemini 2.0，標誌着向能夠獨立完成複雜任務的AI系統邁出了雄心勃勃的一步。同時，Gemini 2.0還引入了原生圖像生成和多語言音頻功能，使得谷歌在日益激烈的AI競爭中與OpenAI和Anthropic展開直接競爭。

新版本的發佈正值谷歌首次推出Gemini的一年後，也正處於AI開發的關鍵時刻。這些新的「代理」AI系統不僅可以響應查詢，還可以理解微妙的上下文，提前規劃多個步驟，並代表用戶採取受監督行動。

谷歌的新AI助手將如何重塑日常數字生活？

在最近的一次新聞發佈會上，Gemini產品管理總監Tulsee Doshi概述了該系統的增強功能，同時展示了實時圖像生成和多語言對話。Doshi解釋說：「Gemini 2.0帶來了增強的性能和新的功能，如原生圖像和多語言音頻生成。它還具有原生智能工具的使用，這意味着它可以直接訪問谷歌產品，如搜索，甚至執行代碼。」

最初的版本以Gemini 2.0 Flash爲中心，這是一個實驗版本，谷歌聲稱其運行速度是其前身的兩倍，同時超越了一些強大模型的功能。這代表着一項重大的技術成就，因爲之前的速度提升通常是以降低功能爲代價的。

走進新一代AI代理

也許最重要的是，谷歌推出了三個基於Gemini 2.0架構的原型AI代理，展示了該公司對AI未來的願景。Project Astra是一款升級後的通用AI助手，展示了它在訪問谷歌工具和維護先前交互的上下文記憶的同時，能夠跨多種語言保持複雜對話的能力。

谷歌DeepMind團隊產品經理Bibo Xu在現場演示中解釋說：「Project Astra現在有長達10分鐘的會話記憶，可以記住你過去與它的對話，這樣你就可以獲得更有用、更個性化的體驗。」

該系統可以在各語言之間平穩過渡，並通過谷歌搜索和地圖訪問實時信息，顯示出了以前在消費者AI產品中看不到的整合水平。

企業AI之戰愈演愈烈

對於開發人員和企業客戶，谷歌推出了Project Mariner和Jules，這兩款專門的AI代理旨在自動化複雜的技術任務。作爲Chrome擴展程序演示的Project Mariner，在WebVoyager基準測試中實現了令人印象深刻的83.5%的成功率，這比之前的自主Web導航嘗試有了顯著改進。該WebVoyager基準主要測試代理在端到端、真實世界的Web任務上的性能。

Google Labs產品管理總監Jaclyn Konzelmann表示：「 Project Mariner是一個早期的研究原型，它探索了瀏覽網頁和採取行動的代理能力。當使用WebVoyager基準進行評估時，Project Mariner取得了83.5%的令人印象深刻的成功率。」

定製硅：谷歌AI雄心背後的基礎設施

支持這些進步的是Trillium，谷歌的第六代Tensor Processing Unit （TPU），如今已普遍可供雲客戶使用。定製的AI加速器代表了對計算基礎設施的巨大投資，谷歌在單個網絡結構中部署了超過10萬個Trillium芯片。

谷歌AI工作室和Gemini API團隊的產品經理Logan Kilpatrick在新聞發佈會上強調了這項基礎設施投資的實際影響。Kilpatrick說：「閃存使用量的增長超過了900%，這令人難以置信。你知道，在過去的幾個月裏，我們已經推出了六個實驗模型，現在有數百萬開發人員在使用Gemini。」

未來之路：自主AI時代的安全問題和競爭

谷歌向自主代理的轉變，可能是自OpenAI發佈ChatGPT以來AI領域最重要的戰略轉折點。雖然競爭對手一直專注於增強大型語言模型的能力，但谷歌認爲，未來屬於能夠主動導航數字環境、並在最少的人爲干預下完成複雜任務的AI系統。

這種能夠思考、計劃和行動的AI代理的願景，代表着與當前響應式AI助理模式的背離。這是一個有風險的賭注，因爲自主系統可能帶來更大的安全問題和技術挑戰。但如果成功，它可能會重塑競爭格局。谷歌在定製硅和基礎設施方面的大規模投資表明，該公司準備在這個新方向上積極競爭。

然而，向更自主的AI系統的過渡引發了新的安全和倫理問題。谷歌強調了其對負責任開發的承諾，包括與值得信賴的用戶進行廣泛的測試和內置的安全措施。谷歌還逐步推出這些功能的方法，從開發人員訪問和值得信賴的測試人員開始，表明了對部署自主AI系統所涉及的潛在風險的認識。

此次Gemini 2.0的發佈正值谷歌面臨競爭對手日益增加的壓力和對AI安全的嚴格審查的關鍵時刻。微軟和OpenAI今年在AI開發方面取得了重大進展，而Anthropic等其他公司也在企業客戶中獲得了吸引力。

谷歌Gemini API集團產品經理Shrestha Basu Mallick在新聞發佈會上強調：「我們堅信，構建AI的唯一方法是從一開始就負責任。隨着我們推進模型和代理，我們將繼續優先考慮將安全和責任作爲模型開發過程的關鍵要素。」

隨着這些系統在現實世界中採取行動的能力越來越強，它們可以從根本上重塑人們與技術的互動方式。Gemini 2.0的成功不僅可以決定谷歌在AI市場的地位，還可以決定隨着行業向更自主的系統發展，AI發展的更廣泛軌跡。

一年前，當谷歌推出Gemini的第一個版本時，AI領域主要由聊天機器人主導，這些機器人可以進行聰明的對話，但在現實世界的任務中卻舉步維艱。現在，隨着AI代理開始朝着自主性邁出第一步，該行業正處於另一個轉折點。問題不再是AI是否能理解我們，而是我們是否準備好讓AI代表我們行事。谷歌正在押注，而且賭注很大。

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

AI迎来转折点：谷歌Gemini 2.0会成为自主AI的开始吗？

AI迎來轉折點：谷歌Gemini 2.0會成爲自主AI的開始嗎？

風險及免責聲明

聲明