正面對決！谷歌推出“最全能”AI模型Gemini，多項指標超GPT-4

全天候科技 · 2023/12/07 07:36

来源：全天候科技

谷歌迈出了在人工智能（AI）科技应用上追赶OpenAI的重要一步，推出手机、云、数据中心都可应用的超级全能AI模型，正面对决GPT-4。

美东时间12月6日周三，谷歌正式向公众发布新一代大语言模型（LLM）Gemini，号称谷歌迄今为止“最大、也最全能的AI模型”，有高级推理能力，回答难题时“考虑得更仔细”。有别于其他公司LLM竞品的是，谷歌强调Gemeni是最灵活的模型，因为它用不同大小的版本，可以适用于各种生成式AI应用。

其中，最轻盈的版本Gemni Nano可以直接在智能手机上离线运行；相对而言更强大的版本Gemini Pro可以执行多种任务，将通过谷歌的类ChatGPT聊天机器人Bard，为众多谷歌AI 服务提供支持，加持谷歌的Gmail、Maps Docs和YouTube等服务；功能最强大的版本Gemini Ultra也是谷歌迄今打造的最强大LLM，主要为数据中心和企业应用而设计。

谷歌旗下AI研究机构DeepMind的产品副总裁Eli Collins称，Gemini的多样性意味着，它“能够在从移动设备到大型数据中心的所有设备上运行。”他表示，谷歌早就希望打造的新一代AI模型更像是乐于助人的合作者，而不是一种智能的软件，Gemini让谷歌距离这种愿景又近了一步。

现在Gemini只有英语版，谷歌将很快推出其他语言的版本。谷歌CEO Sundar Pichai说，Gemini代表了AI的新时代。最终，Gemini将与谷歌的搜索引擎、广告产品、Chrome浏览器等更多产品结合。

具体应用时间表方面，从本周三起，安卓系统开发人员可以注册使用Gemini Nano版，打造智能手机和电脑的Gemini支持App。谷歌称，Gemini可以立即在其旗舰手机Pixel 8 Pro上启用，实现诸如归纳电话录音对话要点等新的生成式AI功能。

Gemini Pro版从本周三开始支持Bard，实现高级的推理、规划、理解等功能，在170个国家地区以英语一种语言操作运行，可能不包括英国或者其他欧洲地区，因为谷歌称在和当地的监管机构合作。

从12月13日下周三开始，谷歌将通过谷歌云，在旗下Vertex AI 和 AI Studio平台向云客户提供 Gemini Pro版。

Gemini Ultra将首先面向开发者和企业客户开放，该版本的应用详情将在下周公布。谷歌计划，明年初，向公众大范围开放Gemini Ultra应用。

谷歌还计划，明年初发布Gemini Ultra支持的进阶版Bard Advanced，在面向大众推出以前，先将推出一个测试项目，以便改进Bard Advanced。

谷歌展示了Gemini家族三个版本。

谷歌此次毫不讳言和GPT-4一较高低的雄心。发布Gemini前，谷歌对它进行了一系列以标准行业指标评估的测试。谷歌称，在八项测试中，Gemini Pro有六项的表现优于OpenAI 的 GPT-3.5。在通用语言理解、推理、数学和编码方面测试中，八项基准指标里，Gemini 有七项超过了OpenAI 的最新版模型 GPT-4。

同时，谷歌评估了旗下可以解释和生成代码的最新生成式AI产品AlphaCode 2，发现在竞争性编程领域，它领先85%的竞争对手。

DeepMind的CEO Demis Hassabis称，谷歌运行了32种完善的基准指标相关测试，对比Gemini和GPT-4这两个模型，既有诸如多任务语言理解这类广泛的整体测试，到生成Python代码这种单一能力的测试。32种基准指标种，Gemini有30项都“遥遥领先”。

在多选问题、数学问题、Python代码任务、阅读等方面，Gemini Pro和Ultra与GPT-4、GPT-3.5等其他LLM的评分对比。

谷歌称，Gemini是一种“原生多模态”AI模型。这意味着它从一开始就经过预先训练，可以处理用户基于文本和图像的提示词任务，支持文本和图像的服务。比如家长可以通过上传数学问题的图像，以及在工作表里尝试解决问题的照片，帮助孩子做家庭作业。Gemini还能阅读答案，理解为何是对的、为何是错的，并解释需要进一步说明的概念。

谷歌称，谷歌搜索运用生成式AI技术的“搜索生成式体验”在明年融入和Gemini的新功能。

谷歌承认，Gemini仍然可能存在AI产生的虚假信息或者捏造信息。Collins 称这是尚未解决的研究问题，不过他说，Gemini有迄今为止谷歌AI模型的最全面安全评估。为评估 Gemini 的安全性，谷歌对该模型进行了对抗性测试，模仿有不良企图的用户利用该模型输入提示词，帮助研究人员检查模型中是否存在仇恨言论和政治偏见。这类测试包括“真实毒性提示词”，它包含从网上提取的10万多个提示词。

谷歌强调Gemini的AI工具效率会非常高、速度非常快。它在谷歌自研的新版云芯片Tensor Processing Units（TPU）上训练，TPU v5p的性能更强，该芯片训练现有模型的速度比前代快2.8倍。TPU v5p是为数据中心的训练和大模型运行而设计。

谷歌机器学习副总裁 Amin Vahdat 表示，这种方法让谷歌“对未来标准AI基础设施有了新的认识”。谷歌仍然使用第三方AI芯片运行Gemini 模型。

风险提示及免责条款市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

编辑/Jeffrey

來源：全天候科技

谷歌邁出了在人工智能（AI）科技應用上追趕OpenAI的重要一步，推出手機、雲、數據中心都可應用的超級全能AI模型，正面對決GPT-4。

美東時間12月6日週三，谷歌正式向公衆發佈新一代大語言模型（LLM）Gemini，號稱谷歌迄今爲止“最大、也最全能的AI模型”，有高級推理能力，回答難題時“考慮得更仔細”。有別於其他公司LLM競品的是，谷歌強調Gemeni是最靈活的模型，因爲它用不同大小的版本，可以適用於各種生成式AI應用。

其中，最輕盈的版本Gemni Nano可以直接在智能手機上離線運行；相對而言更強大的版本Gemini Pro可以執行多種任務，將通過谷歌的類ChatGPT聊天機器人Bard，爲衆多谷歌AI 服務提供支持，加持谷歌的Gmail、Maps Docs和YouTube等服務；功能最強大的版本Gemini Ultra也是谷歌迄今打造的最強大LLM，主要爲數據中心和企業應用而設計。

谷歌旗下AI研究機構DeepMind的產品副總裁Eli Collins稱，Gemini的多樣性意味着，它“能夠在從移動設備到大型數據中心的所有設備上運行。”他表示，谷歌早就希望打造的新一代AI模型更像是樂於助人的合作者，而不是一種智能的軟件，Gemini讓谷歌距離這種願景又近了一步。

現在Gemini只有英語版，谷歌將很快推出其他語言的版本。谷歌CEO Sundar Pichai說，Gemini代表了AI的新時代。最終，Gemini將與谷歌的搜索引擎、廣告產品、Chrome瀏覽器等更多產品結合。

具體應用時間表方面，從本週三起，安卓系統開發人員可以註冊使用Gemini Nano版，打造智能手機和電腦的Gemini支持App。谷歌稱，Gemini可以立即在其旗艦手機Pixel 8 Pro上啓用，實現諸如歸納電話錄音對話要點等新的生成式AI功能。

Gemini Pro版從本週三開始支持Bard，實現高級的推理、規劃、理解等功能，在170個國家地區以英語一種語言操作運行，可能不包括英國或者其他歐洲地區，因爲谷歌稱在和當地的監管機構合作。

從12月13日下週三開始，谷歌將通過谷歌雲，在旗下Vertex AI 和 AI Studio平台向雲客戶提供 Gemini Pro版。

Gemini Ultra將首先面向開發者和企業客戶開放，該版本的應用詳情將在下週公佈。谷歌計劃，明年初，向公衆大範圍開放Gemini Ultra應用。

谷歌還計劃，明年初發布Gemini Ultra支持的進階版Bard Advanced，在面向大衆推出以前，先將推出一個測試項目，以便改進Bard Advanced。

谷歌展示了Gemini家族三個版本。

谷歌此次毫不諱言和GPT-4一較高低的雄心。發佈Gemini前，谷歌對它進行了一系列以標準行業指標評估的測試。谷歌稱，在八項測試中，Gemini Pro有六項的表現優於OpenAI 的 GPT-3.5。在通用語言理解、推理、數學和編碼方面測試中，八項基準指標裏，Gemini 有七項超過了OpenAI 的最新版模型 GPT-4。

同時，谷歌評估了旗下可以解釋和生成代碼的最新生成式AI產品AlphaCode 2，發現在競爭性編程領域，它領先85%的競爭對手。

DeepMind的CEO Demis Hassabis稱，谷歌運行了32種完善的基準指標相關測試，對比Gemini和GPT-4這兩個模型，既有諸如多任務語言理解這類廣泛的整體測試，到生成Python代碼這種單一能力的測試。32種基準指標種，Gemini有30項都“遙遙領先”。

在多選問題、數學問題、Python代碼任務、閱讀等方面，Gemini Pro和Ultra與GPT-4、GPT-3.5等其他LLM的評分對比。

谷歌稱，Gemini是一種“原生多模態”AI模型。這意味着它從一開始就經過預先訓練，可以處理用戶基於文本和圖像的提示詞任務，支持文本和圖像的服務。比如家長可以通過上傳數學問題的圖像，以及在工作表裏嘗試解決問題的照片，幫助孩子做家庭作業。Gemini還能閱讀答案，理解爲何是對的、爲何是錯的，並解釋需要進一步說明的概念。

谷歌稱，谷歌搜索運用生成式AI技術的“搜索生成式體驗”在明年融入和Gemini的新功能。

谷歌承認，Gemini仍然可能存在AI產生的虛假信息或者捏造信息。Collins 稱這是尚未解決的研究問題，不過他說，Gemini有迄今爲止谷歌AI模型的最全面安全評估。爲評估 Gemini 的安全性，谷歌對該模型進行了對抗性測試，模仿有不良企圖的用戶利用該模型輸入提示詞，幫助研究人員檢查模型中是否存在仇恨言論和政治偏見。這類測試包括“真實毒性提示詞”，它包含從網上提取的10萬多個提示詞。

谷歌強調Gemini的AI工具效率會非常高、速度非常快。它在谷歌自研的新版雲芯片Tensor Processing Units（TPU）上訓練，TPU v5p的性能更強，該芯片訓練現有模型的速度比前代快2.8倍。TPU v5p是爲數據中心的訓練和大模型運行而設計。

谷歌機器學習副總裁 Amin Vahdat 表示，這種方法讓谷歌“對未來標準AI基礎設施有了新的認識”。谷歌仍然使用第三方AI芯片運行Gemini 模型。

風險提示及免責條款市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

編輯/Jeffrey

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。

正面对决！谷歌推出“最全能”AI模型Gemini，多项指标超GPT-4

正面對決！谷歌推出“最全能”AI模型Gemini，多項指標超GPT-4

風險及免責聲明

聲明