share_log

报道:谷歌将开发可控制计算机的人工智能

報道:谷歌將開發可控制計算機的人工智能

華爾街見聞 ·  10/27 14:47

據The Information報道,該項目的代號爲「Project Jarvis」,旨在接管用戶的瀏覽器,以幫助消費者完成諸如收集研究、購買產品或預訂航班等各種日常任務。知情人士透露,12月還將發佈谷歌下一代旗艦Gemini大型語言模型,該模型將爲Jarvis提供動力。

10月26日,據The Information報道,谷歌將開發可控制計算機的人工智能,計劃最早在12月預覽這款新的AI產品。

報道稱,這款產品也稱爲「計算機使用代理」,旨在接管用戶的瀏覽器,以幫助消費者完成諸如收集研究、購買產品或預訂航班等各種日常任務。據The Information援引的三位知情人士表示,該項目的代號爲「Project Jarvis」,與Anthropic本週宣佈的一款產品類似。

他們還透露,12月還將發佈谷歌下一代旗艦Gemini大型語言模型,該模型將爲Jarvis提供動力

致力於追趕OpenAI,定製化適配Chrome

不過,Jarvis的發佈時間表表明,儘管谷歌在AI技術的基礎研究方面有着一定積累,但谷歌顯然還在追趕其競爭對手。目前,谷歌仍在開發具有所謂「推理能力」的AI,而OpenAI早在9月份就已經推出了這一功能。

分析認爲,谷歌的Gemini聊天機器人在與OpenAI的ChatGPT競爭中嚴重落後,導致企業紛紛轉向了OpenAI的大型語言模型LLMs,這也使得谷歌的Gemini模型難以迎頭趕上。爲了提高AI開發效率,上週,谷歌將負責Gemini聊天機器人的團隊併入了其主要AI團隊DeepMind.

值得注意的是,當前,AI開發人員已經將“代理(agents,即能夠完成複雜任務而無需人類監督的AI系統)”視爲行業的下一階段。Salesforce、微軟和Workday等企業紛紛從OpenAI和其他公司購買了LLMs,並競相使用這一技術開發AI代理。

Anthropic和谷歌則試圖通過與個人計算機或瀏覽器直接交互的軟件,將AI代理概念推向更深的層次。OpenAI今年的大部分時間也在開發類似的軟件。

知情人士表示,谷歌的這款AI代理產品與Anthropic推出的產品類似,都是通過頻繁截取用戶計算機屏幕上的內容,並在採取點擊按鈕或輸入文本等行動前對截圖進行解釋以響應用戶的命令。

不過,兩家公司的代理產品也存在關鍵差異:

Anthropic表示其產品可以操作安裝於電腦不同應用程序上,而Jarvis目前只能操作瀏覽器,並且已經針對谷歌的Chrome瀏覽器進行了「定製化」調整

知情人士還表示,至少在目前,Jarvis的目標用戶爲那些希望實現網頁日常任務自動化的人。在谷歌今年春天的開發者大會上,首席執行官Sundar Pichai暗示,未來的Gemini版本可以自主執行多項操作,如幫助用戶退回一雙鞋子等。

產品響應速度慢,安全性或受質疑

知情人士還提示道,「Jarvis」的計劃是暫定的,也可能會有所變動。報道稱,谷歌可能會先向少數早期測試者發佈該產品,以幫助識別和修復其不足之處。該代理目前運行速度相對較慢,因爲模型需要在採取每個行動前思考幾秒鐘。

此外,由於谷歌還需要訪問客戶的隱私信息如登錄密碼和信用卡信息等,才能訪問不同的網站來完成任務或根據客戶的要求進行購買。

分析指出,谷歌需要讓人們相信,其AI代理能夠安全地處理他們的個人數據,這是它執行任務所必需的。

除此之外,LLMs還有一些普遍的漏洞,比如可能會產生錯誤答案,此前,谷歌在其搜索引擎中使用LLM驅動的對話式答案,出現了許多明顯的錯誤。

編輯/ping  

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論