【TechWeb】12月30日消息,最近,國產大模型DeepSeek在全球火了,並帶火了一個95後AI「天才少女」羅福莉。據證券時報報道,小米創始人雷軍親自出手,支付千萬年薪「挖人」。
報道稱,雷軍以千萬年薪招攬DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉,領導小米AI大模型團隊。羅福莉將就職於小米AI實驗室。
對此,截至發稿,小米方面暫未置評。
公開資料顯示,羅福莉碩士畢業於北京大學計算語言學研究所。碩士畢業後,她頂着「ACL 8篇論文作者」的光環,加入了阿里達摩院機器智能實驗室。
2022年,羅福莉離開阿里達摩院,加入幻方量化(量化對沖基金公司)從事深度學習相關策略建模和算法研究。此後,羅福莉加入DeepSeek,擔任深度學習研究員,並參與了MoE大模型DeepSeek-V2的研發。
2024年12月,有消息稱,羅福莉將加盟小米,供職於小米AI實驗室,領導小米大模型團隊。
小米被曝正搭建GPU萬卡集群
雷軍重金招攬羅福莉,是小米全面發力AI大模型的其中一個動作。
近日,小米還被曝出正在積極搭建自己的GPU萬卡集群,並對AI大模型進行大規模投資。該計劃已經施行數月之久,雷軍在其中扮演了重要的領導角色。
事實上,早在2023年4月,小米AI實驗室大模型團隊就已成立,欒劍擔任負責人,向AI實驗室主任王斌彙報。欒劍曾在東芝(中國)研究院、微軟(中國)工程院等機構擔任要職,擁有豐富的AI領域經驗。
同年8月,小米大語言模型MiLM首度現身 C-Eval、CMMLU 大模型評測榜單,當時這款模型在 C-Eval 總榜單排名第 10、同參數量級排名第1。
2024年5月,小米公司宣佈,小米大語言模型MiLM正式通過大模型備案,小米大模型將逐步應用於小米汽車、手機、智能家居等產品中。
有知情人士稱,雷軍認爲小米在大模型領域發力太晚,於是親自挖人,重金招募能夠領軍小米大模型的人才,從美國硅谷到中國北京,從算法工程師到AI產品專家,小米的人才佈局正在形成覆蓋全球的AI研發網絡。
雷軍曾在個人微博談及對大模型和AIGC的看法,他表示,小米在AI領域已經耕耘多年。「對於大模型,小米當然會全力以赴,堅決擁抱。」目前,小米在AI領域擁有AI實驗室、小愛同學、自動駕駛等團隊。
公開報道顯示,小米AI實驗室的研究項目數量在過去一年增長了45%,其中多模態交互、圖像生成和語義理解成爲重點方向。
小米2025年研發費用將升至300億
日前,在2024小米人車家全生態合作伙伴大會上,小米集團合夥人、總裁盧偉冰透露,預計2024年小米研發投入爲 240 億元,2025年預計將攀升至300億元。
他預計,自2022年至2026年的五年內,小米的研發投入將超過1000億元,主要聚焦於AI、OS、芯片三大底層技術的研發。
2024年12月27日,小米股價創下2022年以來新高,盤中觸及34.95港元/股。今日開盤,小米股價上漲1.45%,報34.65港元,總市值8658億港元。