share_log

正面对决!谷歌推出“最全能”AI模型Gemini,多项指标超GPT-4

正面對決!谷歌推出“最全能”AI模型Gemini,多項指標超GPT-4

全天候科技 ·  2023/12/07 07:36

來源:全天候科技

谷歌邁出了在人工智能(AI)科技應用上追趕OpenAI的重要一步,推出手機、雲、數據中心都可應用的超級全能AI模型,正面對決GPT-4。

美東時間12月6日週三,谷歌正式向公衆發佈新一代大語言模型(LLM)Gemini,號稱谷歌迄今爲止“最大、也最全能的AI模型”,有高級推理能力,回答難題時“考慮得更仔細”。有別於其他公司LLM競品的是,谷歌強調Gemeni是最靈活的模型,因爲它用不同大小的版本,可以適用於各種生成式AI應用。

其中,最輕盈的版本Gemni Nano可以直接在智能手機上離線運行;相對而言更強大的版本Gemini Pro可以執行多種任務,將通過谷歌的類ChatGPT聊天機器人Bard,爲衆多谷歌AI 服務提供支持,加持谷歌的Gmail、Maps Docs和YouTube等服務;功能最強大的版本Gemini Ultra也是谷歌迄今打造的最強大LLM,主要爲數據中心和企業應用而設計。

谷歌旗下AI研究機構DeepMind的產品副總裁Eli Collins稱,Gemini的多樣性意味着,它“能夠在從移動設備到大型數據中心的所有設備上運行。”他表示,谷歌早就希望打造的新一代AI模型更像是樂於助人的合作者,而不是一種智能的軟件,Gemini讓谷歌距離這種願景又近了一步。

現在Gemini只有英語版,谷歌將很快推出其他語言的版本。谷歌CEO Sundar Pichai說,Gemini代表了AI的新時代。最終,Gemini將與谷歌的搜索引擎、廣告產品、Chrome瀏覽器等更多產品結合。

具體應用時間表方面,從本週三起,安卓系統開發人員可以註冊使用Gemini Nano版,打造智能手機和電腦的Gemini支持App。谷歌稱,Gemini可以立即在其旗艦手機Pixel 8 Pro上啓用,實現諸如歸納電話錄音對話要點等新的生成式AI功能。

Gemini Pro版從本週三開始支持Bard,實現高級的推理、規劃、理解等功能,在170個國家地區以英語一種語言操作運行,可能不包括英國或者其他歐洲地區,因爲谷歌稱在和當地的監管機構合作。

從12月13日下週三開始,谷歌將通過谷歌雲,在旗下Vertex AI 和 AI Studio平台向雲客戶提供 Gemini Pro版。

Gemini Ultra將首先面向開發者和企業客戶開放,該版本的應用詳情將在下週公佈。谷歌計劃,明年初,向公衆大範圍開放Gemini Ultra應用。

谷歌還計劃,明年初發布Gemini Ultra支持的進階版Bard Advanced,在面向大衆推出以前,先將推出一個測試項目,以便改進Bard Advanced。

谷歌展示了Gemini家族三個版本。

谷歌此次毫不諱言和GPT-4一較高低的雄心。發佈Gemini前,谷歌對它進行了一系列以標準行業指標評估的測試。谷歌稱,在八項測試中,Gemini Pro有六項的表現優於OpenAI 的 GPT-3.5。在通用語言理解、推理、數學和編碼方面測試中,八項基準指標裏,Gemini 有七項超過了OpenAI 的最新版模型 GPT-4。

同時,谷歌評估了旗下可以解釋和生成代碼的最新生成式AI產品AlphaCode 2,發現在競爭性編程領域,它領先85%的競爭對手。

DeepMind的CEO Demis Hassabis稱,谷歌運行了32種完善的基準指標相關測試,對比Gemini和GPT-4這兩個模型,既有諸如多任務語言理解這類廣泛的整體測試,到生成Python代碼這種單一能力的測試。32種基準指標種,Gemini有30項都“遙遙領先”。

在多選問題、數學問題、Python代碼任務、閱讀等方面,Gemini Pro和Ultra與GPT-4、GPT-3.5等其他LLM的評分對比。

谷歌稱,Gemini是一種“原生多模態”AI模型。這意味着它從一開始就經過預先訓練,可以處理用戶基於文本和圖像的提示詞任務,支持文本和圖像的服務。比如家長可以通過上傳數學問題的圖像,以及在工作表裏嘗試解決問題的照片,幫助孩子做家庭作業。Gemini還能閱讀答案,理解爲何是對的、爲何是錯的,並解釋需要進一步說明的概念。

谷歌稱,谷歌搜索運用生成式AI技術的“搜索生成式體驗”在明年融入和Gemini的新功能。

谷歌承認,Gemini仍然可能存在AI產生的虛假信息或者捏造信息。Collins 稱這是尚未解決的研究問題,不過他說,Gemini有迄今爲止谷歌AI模型的最全面安全評估。爲評估 Gemini 的安全性,谷歌對該模型進行了對抗性測試,模仿有不良企圖的用戶利用該模型輸入提示詞,幫助研究人員檢查模型中是否存在仇恨言論和政治偏見。這類測試包括“真實毒性提示詞”,它包含從網上提取的10萬多個提示詞。

谷歌強調Gemini的AI工具效率會非常高、速度非常快。它在谷歌自研的新版雲芯片Tensor Processing Units(TPU)上訓練,TPU v5p的性能更強,該芯片訓練現有模型的速度比前代快2.8倍。TPU v5p是爲數據中心的訓練和大模型運行而設計。

谷歌機器學習副總裁 Amin Vahdat 表示,這種方法讓谷歌“對未來標準AI基礎設施有了新的認識”。谷歌仍然使用第三方AI芯片運行Gemini 模型。

風險提示及免責條款市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

編輯/Jeffrey

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論