追蹤AI最新趨勢

GPT-4o不香了？OpenAI競爭對手Anthropic發佈最強大AI模型Claude 3.5

Claude 3.5在阅读、编程、数学等领域多项性能测试中成绩吊打GPT-4o等对手。它理解复杂指令更出色、幽默感增强，App处理速度是前代两倍、成本只有前代模型Claude 3 Opus的五分之一，解读图表图形等视觉推理能力提升明显。Anthropic还推出“Artifacts预览版”，用户能从中编辑和迭代AI模型生成的内容，从对话式AI进化为协作式工作环境。

6月20日周四，OpenAI竞争对手Anthropic发布了公司迄今为止性能最强大的AI模型Claude 3.5 Sonnet。

在覆盖阅读、编程、数学和视觉等领域的多项性能测试中，Claude 3.5 Sonnet的性能略胜一筹，吊打GPT-4o等一众竞争对手的AI模型，且优于自家旗舰模型Claude 3 Opus。当然，也有些测试不能完全反映AI在现实运用的情况，偏小众和个例。

Anthropic的产品负责人Michael Gerstenhaber自信表示道：“对企业来说，重要的是AI是否能帮助他们满足业务需求，而不是AI在性能测试中是否具有竞争力，从这个角度来看，我相信Claude 3.5 Sonnet将领先于我们现有的任何其他产品，也领先于行业中的任何其他产品。”

定价方面，新模型定价与前代3 Sonnet模型相同，即每输入百万token为3美元，每生成百万token为15美元，并具有20万个token的上下文窗口，约合15万个单词。Token是数据的细分单元，例如单词“fantastic”中的“fan”、“tas”和“tic”。

现在，用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型，而订阅了Claude Pro和Claude Team的用户将享受5倍的速率限制。此外，新模型也在Anthropic的API以及亚马逊Bedrock和谷歌云的Vertex AI等托管平台上上线。

今年晚些时候，公司还将推出更大更好的模型，如Claude 3.5 Haiku和Claude 3.5 Opus。后者配备有网络搜索和偏好记忆等功能。

最强视觉模型、速度提升两倍、幽默感增加、内容迭代功能

和前一代模型Claude 3 Opus相比，新模型在多个方面实现了性能上的提升。

例如，与3 Opus相比，Claude 3.5 Sonnet在理解复杂指令和细微差别方面更为出色，甚至能够更好地把握幽默概念，尽管AI在幽默感方面通常表现不佳。

对于需要快速响应的应用程序，如客户服务聊天机器人，3.5 Sonnet的处理速度是Claude 3 Opus的两倍，成本只有其五分之一。

视觉分析方面，3.5 Sonnet能够更准确地解读图表和图形，并能从存在失真和视觉伪影的“不完美”图像中转录文本。

除了新模型的推出，Anthropic还推出了新功能“Artifacts预览版”，这是一个工作空间，允许用户能够编辑和迭代AI模型生成的内容。

想象一下，你在使用一个AI助手来帮你写代码。当你向AI提出你的要求后，AI会生成一段代码。在Artifacts功能中，这段代码不仅仅是显示给你，而是会以一种可以操作和修改的形式出现在你的界面上，就像是一个“工件”或是一个“草稿”。

接下来，你可以对这段代码进行迭代——也就是说，你可以修改它，增加新的功能，或者和 AI 助手“Claude”交流，告诉它你的修改意见或新的需求。AI 会根据你的反馈再次生成代码，你则可以继续这个过程，直到代码达到你的期望，可以被实际运行。

这个过程就像是你和AI一起合作，不断地打磨和完善最终的产品。Artifacts提供了一个平台，让你能够更容易地与AI模型互动，并且对生成的内容进行有效的管理和优化。

目前Artifacts处于预览阶段，Anthropic计划在未来为其增加新功能，比如支持与大型团队协作和知识库存储。

此外，媒体称，Claude 3.5 Sonnet虽然是一个先进的AI模型，但它并不完美，仍然可能会犯错。尽管如此，它的能力可能足以吸引开发者和企业转向Anthropic的平台。毕竟，这才是对Anthropic最重要的。

模型改进部分归功于训练数据，但来源不明

Anthropic的产品负责人Michael Gerstenhaber表示，这些改进归功于模型架构的调整和新的训练数据（包括AI生成的数据）。至于具体是哪些数据带来了这些增强？Gerstenhaber没有透露详细信息。

出于保护商业机密和避免法律挑战的考虑，训练数据的具体细节尚未公开，但Claude 3.5 Sonnet和公司以往AI模型一样，经过了大量文本和图像的训练，并通过人类测试人员的反馈，试图让模型与用户的意图“保持一致”，希望以此防止模型生成有害或有问题的文本。

目前法院尚未做出裁决，即Anthropic等供应商及其竞争对手（如 OpenAI、谷歌、亚马逊等）是否有权使用公共数据（包括受版权保护的数据）进行训练，而无需向这些数据的创作者提供补偿。

新模型对Anthropic和AI生态系统有何意义？

媒体指出，在AI技术的不断演进中，Anthropic公司的Claude 3.5 Sonnet模型虽未带来翻天覆地的变化，却代表了AI模型发展的现阶段现实：在期待重大科研突破的同时，实现逐步的性能提升，即在等待重大研究突破的同时，持续进行小步快跑。

近几个月，包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在内的旗舰产品，仅在基准测试和性能上实现了小幅提升。由于现有模型架构的局限性和训练所需的巨大计算资源，业界尚未再次见证类似从GPT-3到GPT-4的巨大飞跃。

随着生成性AI供应商将重点转向数据整理和许可，投资者对于生成性AI投资回报的预期变得更加审慎。Anthropic得益于亚马逊（以及谷歌的较小程度支持）的有利位置，相对免受这种压力的影响。然而，Anthropic预计到2024年底的营收仅略低于10亿美元，与OpenAI相比仍有较大差距。

Anthropic拥有包括Bridgewater、Brave、Slack和DuckDuckGo等知名品牌在内的不断增长的客户群，但在企业信誉方面仍有提升空间。值得注意的是，普华永道最近选择与OpenAI合作，而非Anthropic，以向企业转售生成性AI产品。

Anthropic意识到，随着模型之间能力差距的缩小，建立一个围绕模型构建生态系统（而不是孤立的模型）是留住客户的关键。

一方面，为了留住客户，Anthropic在加强工具开发。比如允许开发人员深入控制AI模型的内部功能，以及让AI模型能够在应用程序中执行特定的操作。这些工具包括前面提到的Artifacts。

另一方面，公司在扩展团队和市场。Anthropic聘请了Instagram的联合创始人作为产品负责人，这表明公司在产品开发方面的重视。此外，公司在伦敦和都柏林设立了办公室，这有助于扩大其产品的市场覆盖。

当然，成本也很重要。Anthropic产品负责人Michael Gerstenhaber表示：“当你在构建应用程序时，最终用户不需要关心背后使用的模型或优化细节，而工程师则可以利用工具来优化体验，其中成本是一个重要因素。”

编辑/Somer

Claude 3.5在閱讀、編程、數學等領域多項性能測試中成績吊打GPT-4o等對手。它理解複雜指令更出色、幽默感增強，App處理速度是前代兩倍、成本只有前代模型Claude 3 Opus的五分之一，解讀圖表圖形等視覺推理能力提升明顯。Anthropic還推出“Artifacts預覽版”，用戶能從中編輯和迭代AI模型生成的內容，從對話式AI進化爲協作式工作環境。

6月20日週四，OpenAI競爭對手Anthropic發佈了公司迄今爲止性能最強大的AI模型Claude 3.5 Sonnet。

在覆蓋閱讀、編程、數學和視覺等領域的多項性能測試中，Claude 3.5 Sonnet的性能略勝一籌，吊打GPT-4o等一衆競爭對手的AI模型，且優於自家旗艦模型Claude 3 Opus。當然，也有些測試不能完全反映AI在現實運用的情況，偏小衆和個例。

Anthropic的產品負責人Michael Gerstenhaber自信表示道：“對企業來說，重要的是AI是否能幫助他們滿足業務需求，而不是AI在性能測試中是否具有競爭力，從這個角度來看，我相信Claude 3.5 Sonnet將領先於我們現有的任何其他產品，也領先於行業中的任何其他產品。”

定價方面，新模型定價與前代3 Sonnet模型相同，即每輸入百萬token爲3美元，每生成百萬token爲15美元，並具有20萬個token的上下文窗口，約合15萬個單詞。Token是數據的細分單元，例如單詞“fantastic”中的“fan”、“tas”和“tic”。

現在，用戶可以通過Anthropic的網頁客戶端和iOS應用免費試用新模型，而訂閱了Claude Pro和Claude Team的用戶將享受5倍的速率限制。此外，新模型也在Anthropic的API以及亞馬遜Bedrock和谷歌雲的Vertex AI等託管平台上上線。

今年晚些時候，公司還將推出更大更好的模型，如Claude 3.5 Haiku和Claude 3.5 Opus。後者配備有網絡搜索和偏好記憶等功能。

最強視覺模型、速度提升兩倍、幽默感增加、內容迭代功能

和前一代模型Claude 3 Opus相比，新模型在多個方面實現了性能上的提升。

例如，與3 Opus相比，Claude 3.5 Sonnet在理解複雜指令和細微差別方面更爲出色，甚至能夠更好地把握幽默概念，儘管AI在幽默感方面通常表現不佳。

對於需要快速響應的應用程序，如客戶服務聊天機器人，3.5 Sonnet的處理速度是Claude 3 Opus的兩倍，成本只有其五分之一。

視覺分析方面，3.5 Sonnet能夠更準確地解讀圖表和圖形，並能從存在失真和視覺僞影的“不完美”圖像中轉錄文本。

除了新模型的推出，Anthropic還推出了新功能“Artifacts預覽版”，這是一個工作空間，允許用戶能夠編輯和迭代AI模型生成的內容。

想象一下，你在使用一個AI助手來幫你寫代碼。當你向AI提出你的要求後，AI會生成一段代碼。在Artifacts功能中，這段代碼不僅僅是顯示給你，而是會以一種可以操作和修改的形式出現在你的界面上，就像是一個“工件”或是一個“草稿”。

接下來，你可以對這段代碼進行迭代——也就是說，你可以修改它，增加新的功能，或者和 AI 助手“Claude”交流，告訴它你的修改意見或新的需求。AI 會根據你的反饋再次生成代碼，你則可以繼續這個過程，直到代碼達到你的期望，可以被實際運行。

這個過程就像是你和AI一起合作，不斷地打磨和完善最終的產品。Artifacts提供了一個平台，讓你能夠更容易地與AI模型互動，並且對生成的內容進行有效的管理和優化。

目前Artifacts處於預覽階段，Anthropic計劃在未來爲其增加新功能，比如支持與大型團隊協作和知識庫存儲。

此外，媒體稱，Claude 3.5 Sonnet雖然是一個先進的AI模型，但它並不完美，仍然可能會犯錯。儘管如此，它的能力可能足以吸引開發者和企業轉向Anthropic的平台。畢竟，這才是對Anthropic最重要的。

模型改進部分歸功於訓練數據，但來源不明

Anthropic的產品負責人Michael Gerstenhaber表示，這些改進歸功於模型架構的調整和新的訓練數據（包括AI生成的數據）。至於具體是哪些數據帶來了這些增強？Gerstenhaber沒有透露詳細信息。

出於保護商業機密和避免法律挑戰的考慮，訓練數據的具體細節尚未公開，但Claude 3.5 Sonnet和公司以往AI模型一樣，經過了大量文本和圖像的訓練，並通過人類測試人員的反饋，試圖讓模型與用戶的意圖“保持一致”，希望以此防止模型生成有害或有問題的文本。

目前法院尚未做出裁決，即Anthropic等供應商及其競爭對手（如 OpenAI、谷歌、亞馬遜等）是否有權使用公共數據（包括受版權保護的數據）進行訓練，而無需向這些數據的創作者提供補償。

新模型對Anthropic和AI生態系統有何意義？

媒體指出，在AI技術的不斷演進中，Anthropic公司的Claude 3.5 Sonnet模型雖未帶來翻天覆地的變化，卻代表了AI模型發展的現階段現實：在期待重大科研突破的同時，實現逐步的性能提升，即在等待重大研究突破的同時，持續進行小步快跑。

近幾個月，包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在內的旗艦產品，僅在基準測試和性能上實現了小幅提升。由於現有模型架構的侷限性和訓練所需的巨大計算資源，業界尚未再次見證類似從GPT-3到GPT-4的巨大飛躍。

隨着生成性AI供應商將重點轉向數據整理和許可，投資者對於生成性AI投資回報的預期變得更加審慎。Anthropic得益於亞馬遜（以及谷歌的較小程度支持）的有利位置，相對免受這種壓力的影響。然而，Anthropic預計到2024年底的營收僅略低於10億美元，與OpenAI相比仍有較大差距。

Anthropic擁有包括Bridgewater、Brave、Slack和DuckDuckGo等知名品牌在內的不斷增長的客戶群，但在企業信譽方面仍有提升空間。值得注意的是，普華永道最近選擇與OpenAI合作，而非Anthropic，以向企業轉售生成性AI產品。

Anthropic意識到，隨着模型之間能力差距的縮小，建立一個圍繞模型構建生態系統（而不是孤立的模型）是留住客戶的關鍵。

一方面，爲了留住客戶，Anthropic在加強工具開發。比如允許開發人員深入控制AI模型的內部功能，以及讓AI模型能夠在應用程序中執行特定的操作。這些工具包括前面提到的Artifacts。

另一方面，公司在擴展團隊和市場。Anthropic聘請了Instagram的聯合創始人作爲產品負責人，這表明公司在產品開發方面的重視。此外，公司在倫敦和都柏林設立了辦公室，這有助於擴大其產品的市場覆蓋。

當然，成本也很重要。Anthropic產品負責人Michael Gerstenhaber表示：“當你在構建應用程序時，最終用戶不需要關心背後使用的模型或優化細節，而工程師則可以利用工具來優化體驗，其中成本是一個重要因素。”

編輯/Somer

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。