聚焦港美股

報道：谷歌將開發可控制計算機的人工智能

据The Information报道，该项目的代号为“Project Jarvis”，旨在接管用户的浏览器，以帮助消费者完成诸如收集研究、购买产品或预订航班等各种日常任务。知情人士透露，12月还将发布谷歌下一代旗舰Gemini大型语言模型，该模型将为Jarvis提供动力。

10月26日，据The Information报道，谷歌将开发可控制计算机的人工智能，计划最早在12月预览这款新的AI产品。

报道称，这款产品也称为“计算机使用代理”，旨在接管用户的浏览器，以帮助消费者完成诸如收集研究、购买产品或预订航班等各种日常任务。据The Information援引的三位知情人士表示，该项目的代号为“Project Jarvis”，与Anthropic本周宣布的一款产品类似。

他们还透露，12月还将发布谷歌下一代旗舰Gemini大型语言模型，该模型将为Jarvis提供动力。

致力于追赶OpenAI，定制化适配Chrome

不过，Jarvis的发布时间表表明，尽管谷歌在AI技术的基础研究方面有着一定积累，但谷歌显然还在追赶其竞争对手。目前，谷歌仍在开发具有所谓“推理能力”的AI，而OpenAI早在9月份就已经推出了这一功能。

分析认为，谷歌的Gemini聊天机器人在与OpenAI的ChatGPT竞争中严重落后，导致企业纷纷转向了OpenAI的大型语言模型LLMs，这也使得谷歌的Gemini模型难以迎头赶上。为了提高AI开发效率，上周，谷歌将负责Gemini聊天机器人的团队并入了其主要AI团队DeepMind.

值得注意的是，当前，AI开发人员已经将“代理（agents，即能够完成复杂任务而无需人类监督的AI系统）”视为行业的下一阶段。Salesforce、微软和Workday等企业纷纷从OpenAI和其他公司购买了LLMs，并竞相使用这一技术开发AI代理。

Anthropic和谷歌则试图通过与个人计算机或浏览器直接交互的软件，将AI代理概念推向更深的层次。OpenAI今年的大部分时间也在开发类似的软件。

知情人士表示，谷歌的这款AI代理产品与Anthropic推出的产品类似，都是通过频繁截取用户计算机屏幕上的内容，并在采取点击按钮或输入文本等行动前对截图进行解释以响应用户的命令。

不过，两家公司的代理产品也存在关键差异：

Anthropic表示其产品可以操作安装于电脑不同应用程序上，而Jarvis目前只能操作浏览器，并且已经针对谷歌的Chrome浏览器进行了“定制化”调整。

知情人士还表示，至少在目前，Jarvis的目标用户为那些希望实现网页日常任务自动化的人。在谷歌今年春天的开发者大会上，首席执行官Sundar Pichai暗示，未来的Gemini版本可以自主执行多项操作，如帮助用户退回一双鞋子等。

产品响应速度慢，安全性或受质疑

知情人士还提示道，“Jarvis”的计划是暂定的，也可能会有所变动。报道称，谷歌可能会先向少数早期测试者发布该产品，以帮助识别和修复其不足之处。该代理目前运行速度相对较慢，因为模型需要在采取每个行动前思考几秒钟。

此外，由于谷歌还需要访问客户的隐私信息如登录密码和信用卡信息等，才能访问不同的网站来完成任务或根据客户的要求进行购买。

分析指出，谷歌需要让人们相信，其AI代理能够安全地处理他们的个人数据，这是它执行任务所必需的。

除此之外，LLMs还有一些普遍的漏洞，比如可能会产生错误答案，此前，谷歌在其搜索引擎中使用LLM驱动的对话式答案，出现了许多明显的错误。

编辑/ping

據The Information報道，該項目的代號爲「Project Jarvis」，旨在接管用戶的瀏覽器，以幫助消費者完成諸如收集研究、購買產品或預訂航班等各種日常任務。知情人士透露，12月還將發佈谷歌下一代旗艦Gemini大型語言模型，該模型將爲Jarvis提供動力。

10月26日，據The Information報道，谷歌將開發可控制計算機的人工智能，計劃最早在12月預覽這款新的AI產品。

報道稱，這款產品也稱爲「計算機使用代理」，旨在接管用戶的瀏覽器，以幫助消費者完成諸如收集研究、購買產品或預訂航班等各種日常任務。據The Information援引的三位知情人士表示，該項目的代號爲「Project Jarvis」，與Anthropic本週宣佈的一款產品類似。

他們還透露，12月還將發佈谷歌下一代旗艦Gemini大型語言模型，該模型將爲Jarvis提供動力。

致力於追趕OpenAI，定製化適配Chrome

不過，Jarvis的發佈時間表表明，儘管谷歌在AI技術的基礎研究方面有着一定積累，但谷歌顯然還在追趕其競爭對手。目前，谷歌仍在開發具有所謂「推理能力」的AI，而OpenAI早在9月份就已經推出了這一功能。

分析認爲，谷歌的Gemini聊天機器人在與OpenAI的ChatGPT競爭中嚴重落後，導致企業紛紛轉向了OpenAI的大型語言模型LLMs，這也使得谷歌的Gemini模型難以迎頭趕上。爲了提高AI開發效率，上週，谷歌將負責Gemini聊天機器人的團隊併入了其主要AI團隊DeepMind.

值得注意的是，當前，AI開發人員已經將“代理（agents，即能夠完成複雜任務而無需人類監督的AI系統）”視爲行業的下一階段。Salesforce、微軟和Workday等企業紛紛從OpenAI和其他公司購買了LLMs，並競相使用這一技術開發AI代理。

Anthropic和谷歌則試圖通過與個人計算機或瀏覽器直接交互的軟件，將AI代理概念推向更深的層次。OpenAI今年的大部分時間也在開發類似的軟件。

知情人士表示，谷歌的這款AI代理產品與Anthropic推出的產品類似，都是通過頻繁截取用戶計算機屏幕上的內容，並在採取點擊按鈕或輸入文本等行動前對截圖進行解釋以響應用戶的命令。

不過，兩家公司的代理產品也存在關鍵差異：

Anthropic表示其產品可以操作安裝於電腦不同應用程序上，而Jarvis目前只能操作瀏覽器，並且已經針對谷歌的Chrome瀏覽器進行了「定製化」調整。

知情人士還表示，至少在目前，Jarvis的目標用戶爲那些希望實現網頁日常任務自動化的人。在谷歌今年春天的開發者大會上，首席執行官Sundar Pichai暗示，未來的Gemini版本可以自主執行多項操作，如幫助用戶退回一雙鞋子等。

產品響應速度慢，安全性或受質疑

知情人士還提示道，「Jarvis」的計劃是暫定的，也可能會有所變動。報道稱，谷歌可能會先向少數早期測試者發佈該產品，以幫助識別和修復其不足之處。該代理目前運行速度相對較慢，因爲模型需要在採取每個行動前思考幾秒鐘。

此外，由於谷歌還需要訪問客戶的隱私信息如登錄密碼和信用卡信息等，才能訪問不同的網站來完成任務或根據客戶的要求進行購買。

分析指出，谷歌需要讓人們相信，其AI代理能夠安全地處理他們的個人數據，這是它執行任務所必需的。

除此之外，LLMs還有一些普遍的漏洞，比如可能會產生錯誤答案，此前，谷歌在其搜索引擎中使用LLM驅動的對話式答案，出現了許多明顯的錯誤。

編輯/ping

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。