大模型领域,开源与闭源之争一直是技术和产业界关注的焦点。阿里云通义千问最新发布的Qwen2系列模型,为这场争论提供了最新的答案。
6月7日,通义千问推出开源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整体性能相比Qwen1.5-110B大幅提升!一举超越了美国最强的开源模型Llama3-70B,更是将文心4.0等中国众多闭源模型甩在身后,登上最强开源大模型的宝座。
OpenCompass大模型测评榜单上,Qwen1.5-110B已领先于文心4.0等一众中国闭源模型对比当前最优的开源模型,Qwen2-72B在多项能力上均处于领先Qwen2系列模型除了技术性能上的提升,还展现了更多的应用潜力。其多语言处理、长文本处理、代码生成、数学和逻辑推理等能力,已经在MMLU、GPQA、HumanEval等国际测评中得到了验证。
代码及数学能力也得到了显著提升此前存在一种观点认为在大模型的开发上,闭源模型因为其庞大的投资和资源积累,相较开源模型具有不可比拟的优势,导致了一种看似共识的观念:开源模型难以追赶闭源模型的步伐。
单一的公司的闭源模型,如果有大量资金和资源投入,的确可以在短期内推动技术的发展,这一点在OpenAI上已经得到了验证。而且不可否认,选择闭源的OpenAI在性能上仍然是业界最强。
而这次阿里云Qwen2的发布,表明开源模型同样能够达到甚至超越闭源模型的高性能。这不仅让开源模型落后闭源模型的论调不攻自破,也再次证明了开源大模型不仅不会越来越落后,在技术上更是有着无限的可能。开源大模型能够做到足够强,并且会越来越强。
同时这也是对开源价值的再一次阐释,Qwen系列的开源模型除了为技术社区贡献了一项重要的资源,也鼓励了全球性的创新合作,进一步强化了开源大模型生态系统的活力和包容性。
值得一提的是,阿里云在1个月前刚刚发布中文场景性能超过GPT-4的闭源模型——通义千问2.5,从这个角度来看开闭源的路线选择,阿里云实际上是两条腿走路。既利用开源的优势进行广泛的技术传播和创新,又通过闭源的方式保障关键技术的领先和商业应用的稳定。这种类似于双轨制的策略,使得阿里云能够在技术创新和商业化应用中取得平衡,实现技术价值的最大化。
所以,开源与闭源并不矛盾,而是在不同的场景和需求下扮演着各自独特的角色,这并不是一道非此即彼的选择题,也是时候为两者的路线之争画下休止符了。
Qwen2问世,卷起千层浪
Qwen2不仅仅意味着开源大模型阵营诞生了新标杆,它已在整个行业里卷起千层浪。Qwen2系列模型的API已经登陆自家的阿里云百炼平台,众多全球开源平台和工具也第一时间宣布对Qwen2的支持,包括Tensor-RT、OpenVINO、OpenCompass、XTuner、LLaMA-factory、Firefly、OpenBuddy、vLLM、Ollama等等,这样的生态影响力在国产大模型行列里绝无仅有。
Qwen2这次的开源在X上也引发了大量的讨论:海外网友和开发者纷纷欢迎这款最强开源模型的到来。
“自Llama 3以来,Qwen2是最具影响力的开源LLM,性能超过了Llama 3,在学术和聊天方面达到了最先进的性能”Hugging Face创始人第一时间发来贺电 事实上,过去10个月里,这样的场景并不是阿里云开源大模型仅有的高光时刻。据了解,Qwen系列模型总下载量已突破1600万次。在全球开源社区出现了超过1500款基于Qwen二次开发的模型,Qwen系列的72B、110B模型多次登顶HuggingFace 的Open LLM Leaderboard开源模型榜单,其国际社会认可度及开发者好感度可见一斑。
大洋彼岸的Meta试图用Llama系列一统开源天下,而阿里的通义千问的出现为全球开发者提供了另一项选择,也让我们看到了“国外一开源,国内就自主”说法的偏颇。市场会用脚投票,以Qwen为代表的国内开源模型所作出的贡献被长期忽视的现状,一定会随着更多全球企业和开发者的认可,逐渐扭转过来。
开源的Qwen,开放的阿里云
开源与互联网的发展紧密相连,自1970年代Unix和互联网问世之初,开源就随之出现。如果不是开源运动的推进,许多技术仍可能被少数巨头企业所垄断,阻碍科技普惠程度,我们所见证的科技创新浪潮也将不复存在。
对于大模型行业来说,有了更好的开源模型,才能够吸引更多人才参与到相关技术创新研究中。有了更好的开源模型,更多中小企业才能真正用上大模型,才会有更多对大模型产品应用的探索。
阿里云对开源的坚持,本质上是相信开放的力量,也就是阿里云CTO周靖人所说,“坚持开源开放是阿里云的重要策略,我们希望打造一朵AI时代最开放的云,让算力更普惠、让AI更普及。”这种坚定的开源策略,不仅为技术创新提供了土壤,也为全球开发者提供了平台。
开放是为了服务好客户,阿里云百炼集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具。
开放也是为了生态的繁荣,把饼做大,才能更好的分饼。在阿里云魔搭社区上,汇聚了大量开源模型,成为国内开发者最活跃的AI社区。
选择开源还是闭源,不仅是企业的战略决策,更会影响商业模式。不可否认的是大模型的开源存在商业模式不明朗的问题,比如扎克伯格也一直在评估自身能否从云服务厂商使用Llama相关收入中进行分成,毕竟Meta不太可能为了Llama去开辟云计算业务。
而对阿里云这样一家提供基础设施的云厂商来说,商业逻辑就十分清晰了。在大模型技术带动云计算增量需求,几乎是一个确定性趋势的背景下,Qwen的开源不需要带来直接的商业化收益,而是吸引更多的厂商和开发者,来使用阿里云打造的基础设施,以及包括闭源模型在内的相关服务,从底层的算力基座,到大模型应用的构建,再到开放的AI生态,从而形成完整的商业模式。
通过亲自下场打造并开源Qwen系列模型,同时为大模型的落地提供完善的工具和平台,阿里云走出一条与Meta、微软、AWS等顶级玩家不同的道路,这种云+AI的示范效应,已成为一种行业标准,对客户选择阿里云来探索大模型提供了一种天然的说服力。
这在全球大模型厂商中也是独一份。
Qwen是阿里AGI愿景的重要拼图
在AGI成为科技巨头们新战场的当下,阿里巴巴清晰地表明了其在这一领域的坚定信心和战略布局。在阿里发布的2024财年致股东信中,明确提出电商和云计算是阿里的两大核心业务,并将通过持续投资保持基础技术的领先地位,包括人工智能在内的创新。
从技术发展的角度来看,AI的进步经历了数次重要的飞跃,已经深刻改变了各个行业的面貌。云计算的普及进一步加速了AI的发展,使得大规模数据处理和复杂模型训练成为可能。在这一历史背景下,阿里云通过其云计算基础设施和持续的技术创新,推动了AI技术的前沿探索,Qwen的领先以及在全球范围获得了认可,正是阿里云计算与AI结合战略的产物。
从商业发展的角度,技术创新一直是企业竞争力的核心驱动力。阿里云通过将AI与云计算的深度融合,不仅开辟了在AI时代的商业模式,也获得了持续增长的路径。
在近期与摩根大通的对话中,阿里巴巴副主席蔡崇信再次表示AI和云计算的结合至关重要,并强调了阿里对AGI愿景的坚定信念。现在来看,阿里云已然为这一愿景打造了一块关键拼图。
大模型領域,開源與閉源之爭一直是技術和產業界關注的焦點。阿里雲通義千問最新發布的Qwen2系列模型,爲這場爭論提供了最新的答案。
6月7日,通義千問推出開源模型系列Qwen2,包括5款模型:0.5B、1.5B、7B、72B、MoE,其中,Qwen2-72B整體性能相比Qwen1.5-110B大幅提升!一舉超越了美國最強的開源模型Llama3-70B,更是將文心4.0等中國衆多閉源模型甩在身後,登上最強開源大模型的寶座。
OpenCompass大模型測評榜單上,Qwen1.5-110B已領先於文心4.0等一衆中國閉源模型對比當前最優的開源模型,Qwen2-72B在多項能力上均處於領先Qwen2系列模型除了技術性能上的提升,還展現了更多的應用潛力。其多語言處理、長文本處理、代碼生成、數學和邏輯推理等能力,已經在MMLU、GPQA、HumanEval等國際測評中得到了驗證。
代碼及數學能力也得到了顯著提升此前存在一種觀點認爲在大模型的開發上,閉源模型因爲其龐大的投資和資源積累,相較開源模型具有不可比擬的優勢,導致了一種看似共識的觀念:開源模型難以追趕閉源模型的步伐。
單一的公司的閉源模型,如果有大量資金和資源投入,的確可以在短期內推動技術的發展,這一點在OpenAI上已經得到了驗證。而且不可否認,選擇閉源的OpenAI在性能上仍然是業界最強。
而這次阿里雲Qwen2的發佈,表明開源模型同樣能夠達到甚至超越閉源模型的高性能。這不僅讓開源模型落後閉源模型的論調不攻自破,也再次證明了開源大模型不僅不會越來越落後,在技術上更是有着無限的可能。開源大模型能夠做到足夠強,並且會越來越強。
同時這也是對開源價值的再一次闡釋,Qwen系列的開源模型除了爲技術社區貢獻了一項重要的資源,也鼓勵了全球性的創新合作,進一步強化了開源大模型生態系統的活力和包容性。
值得一提的是,阿里雲在1個月前剛剛發佈中文場景性能超過GPT-4的閉源模型——通義千問2.5,從這個角度來看開閉源的路線選擇,阿里雲實際上是兩條腿走路。既利用開源的優勢進行廣泛的技術傳播和創新,又通過閉源的方式保障關鍵技術的領先和商業應用的穩定。這種類似於雙軌制的策略,使得阿里雲能夠在技術創新和商業化應用中取得平衡,實現技術價值的最大化。
所以,開源與閉源並不矛盾,而是在不同的場景和需求下扮演着各自獨特的角色,這並不是一道非此即彼的選擇題,也是時候爲兩者的路線之爭畫下休止符了。
Qwen2問世,捲起千層浪
Qwen2不僅僅意味着開源大模型陣營誕生了新標杆,它已在整個行業裏捲起千層浪。Qwen2系列模型的API已經登陸自家的阿里雲百鍊平台,衆多全球開源平台和工具也第一時間宣佈對Qwen2的支持,包括Tensor-RT、OpenVINO、OpenCompass、XTuner、LLaMA-factory、Firefly、OpenBuddy、vLLM、Ollama等等,這樣的生態影響力在國產大模型行列裏絕無僅有。
Qwen2這次的開源在X上也引發了大量的討論:海外網友和開發者紛紛歡迎這款最強開源模型的到來。
“自Llama 3以來,Qwen2是最具影響力的開源LLM,性能超過了Llama 3,在學術和聊天方面達到了最先進的性能”Hugging Face創始人第一時間發來賀電 事實上,過去10個月裏,這樣的場景並不是阿里雲開源大模型僅有的高光時刻。據了解,Qwen系列模型總下載量已突破1600萬次。在全球開源社區出現了超過1500款基於Qwen二次開發的模型,Qwen系列的72B、110B模型多次登頂HuggingFace 的Open LLM Leaderboard開源模型榜單,其國際社會認可度及開發者好感度可見一斑。
大洋彼岸的Meta試圖用Llama系列一統開源天下,而阿里的通義千問的出現爲全球開發者提供了另一項選擇,也讓我們看到了“國外一開源,國內就自主”說法的偏頗。市場會用腳投票,以Qwen爲代表的國內開源模型所作出的貢獻被長期忽視的現狀,一定會隨着更多全球企業和開發者的認可,逐漸扭轉過來。
開源的Qwen,開放的阿里雲
開源與互聯網的發展緊密相連,自1970年代Unix和互聯網問世之初,開源就隨之出現。如果不是開源運動的推進,許多技術仍可能被少數巨頭企業所壟斷,阻礙科技普惠程度,我們所見證的科技創新浪潮也將不復存在。
對於大模型行業來說,有了更好的開源模型,才能夠吸引更多人才參與到相關技術創新研究中。有了更好的開源模型,更多中小企業才能真正用上大模型,才會有更多對大模型產品應用的探索。
阿里雲對開源的堅持,本質上是相信開放的力量,也就是阿里雲CTO周靖人所說,“堅持開源開放是阿里雲的重要策略,我們希望打造一朵AI時代最開放的雲,讓算力更普惠、讓AI更普及。”這種堅定的開源策略,不僅爲技術創新提供了土壤,也爲全球開發者提供了平台。
開放是爲了服務好客戶,阿里雲百鍊集成了國內外主流優質大模型,提供模型選型、微調訓練、安全套件、模型部署等服務和全鏈路的應用開發工具。
開放也是爲了生態的繁榮,把餅做大,才能更好的分餅。在阿里雲魔搭社區上,匯聚了大量開源模型,成爲國內開發者最活躍的AI社區。
選擇開源還是閉源,不僅是企業的戰略決策,更會影響商業模式。不可否認的是大模型的開源存在商業模式不明朗的問題,比如扎克伯格也一直在評估自身能否從雲服務廠商使用Llama相關收入中進行分成,畢竟Meta不太可能爲了Llama去開闢雲計算業務。
而對阿里雲這樣一家提供基礎設施的雲廠商來說,商業邏輯就十分清晰了。在大模型技術帶動雲計算增量需求,幾乎是一個確定性趨勢的背景下,Qwen的開源不需要帶來直接的商業化收益,而是吸引更多的廠商和開發者,來使用阿里雲打造的基礎設施,以及包括閉源模型在內的相關服務,從底層的算力基座,到大模型應用的構建,再到開放的AI生態,從而形成完整的商業模式。
通過親自下場打造並開源Qwen系列模型,同時爲大模型的落地提供完善的工具和平台,阿里雲走出一條與Meta、微軟、AWS等頂級玩家不同的道路,這種雲+AI的示範效應,已成爲一種行業標準,對客戶選擇阿里雲來探索大模型提供了一種天然的說服力。
這在全球大模型廠商中也是獨一份。
Qwen是阿里AGI願景的重要拼圖
在AGI成爲科技巨頭們新戰場的當下,阿里巴巴清晰地表明瞭其在這一領域的堅定信心和戰略佈局。在阿里發佈的2024財年致股東信中,明確提出電商和雲計算是阿里的兩大核心業務,並將通過持續投資保持基礎技術的領先地位,包括人工智能在內的創新。
從技術發展的角度來看,AI的進步經歷了數次重要的飛躍,已經深刻改變了各個行業的面貌。雲計算的普及進一步加速了AI的發展,使得大規模數據處理和複雜模型訓練成爲可能。在這一歷史背景下,阿里雲通過其雲計算基礎設施和持續的技術創新,推動了AI技術的前沿探索,Qwen的領先以及在全球範圍獲得了認可,正是阿里雲計算與AI結合戰略的產物。
從商業發展的角度,技術創新一直是企業競爭力的核心驅動力。阿里雲通過將AI與雲計算的深度融合,不僅開闢了在AI時代的商業模式,也獲得了持續增長的路徑。
在近期與摩根大通的對話中,阿里巴巴副主席蔡崇信再次表示AI和雲計算的結合至關重要,並強調了阿里對AGI願景的堅定信念。現在來看,阿里雲已然爲這一願景打造了一塊關鍵拼圖。