豆包大模型的持續迭代,將助力多場景AI應用加快落地及商業化空間打開。
智通財經APP獲悉,開源證券發佈研報稱,根據火山引擎數據,豆包大模型12月日均tokens使用量超過4萬億,較5月發佈時期增長超過33倍,豆包大模型在信息處理、客服與銷售、硬件助手、AI工具等場景的調用量也在快速增長。不斷增加的調用量和多場景覆蓋使豆包大模型越來越全面,並迎來全面升級,其中豆包通用模型pro完成新版本迭代,綜合任務處理能力較5月份提升32%。豆包大模型的持續迭代,將助力多場景AI應用加快落地及商業化空間打開。
開源證券主要觀點如下:
字節跳動發佈豆包視覺理解模型,多場景應用有望落地
12月18日,字節跳動旗下火山引擎於2024 FORCE原動力大會發布了豆包視覺理解模型。通過豆包視覺理解模型,用戶可以同時輸入文本和圖像相關的問題。模型能夠綜合理解並給出準確的回答,大幅簡化開發流程。
豆包視覺理解模型主要有三大能力:(1)更強的內容識別能力,不僅可以識別出圖像中的物體類別、形狀等基本要素,還能理解物體之間的關係、空間佈局以及場景的整體含義;(2)更強的理解和推理能力,不僅能識別圖文信息,還能進行復雜的邏輯計算;(3)更細膩的視覺描述能力,可以基於圖像信息,更細膩的描述圖像呈現的內容,還能進行多種文體的創作。
基於這些能力,豆包視覺理解模型在教育、旅遊、電商等場景有着廣泛的應用。例如在教育場景中,爲學生優化作文、科普知識;在旅遊場景中,幫助遊客看外文菜單、講解照片中建築的背景知識;在電商營銷場景中,幫助商家充分描述商品細節,高效發佈種草廣告等等。此外,豆包視覺理解的輸入價格爲每千tokens 0.003元,比行業平均價格降低85%,有利於企業和開發者利於視覺理解模型,在更廣泛的場景創造商業價值。
豆包大模型使用量大幅增長,模型家族再擴容,多模態能力不斷提升
根據火山引擎數據,豆包大模型12月日均tokens使用量超過4萬億,較5月發佈時期增長超過33倍,豆包大模型在信息處理、客服與銷售、硬件助手、AI工具等場景的調用量也在快速增長。不斷增加的調用量和多場景覆蓋使豆包大模型越來越全面,並迎來全面升級,其中豆包通用模型pro完成新版本迭代,綜合任務處理能力較5月份提升32%。
除了視覺理解模型,火山引擎還發布了豆包音樂模型4.0、豆包文生圖模型2.1以及veOmniverse+豆包3D生成模型,豆包視頻生成模型將在2025年1月正式對外開放服務,明年春季,字節跳動還將發佈具備更長視頻生成能力的豆包視頻生成模型1.5版。此外,火山引擎還推出全域AI搜索,通過場景化搜索推薦一體化服務、企業私域信息整合服務、聯網問答服務,將企業的信息、業務和用戶需求緊密結合,加速多行業智能化轉型。
豆包大模型有望帶動大模型產業快速發展,關注相關AI應用投資機會
豆包多模態模型訓練或帶動對文字、圖片以及3D素材語料需求,重點推薦鋒尚文化,受益標的包括視覺中國(000681.SZ)、絲路視覺(300556.SZ)、天娛數科(002354.SZ)、中文在線(300364.SZ)、掌閱科技(603533.SH)等;豆包音樂模型或加速AI音樂用戶滲透,重點推薦盛天網絡(300494.SZ);豆包視頻生成模型或加速影視內容生產和IP變現降本增效,重點推薦上海電影(601595.SH),受益標的包括捷成股份(300182.SZ)、華策影視(300133.SZ)、光線傳媒(300251.SZ)等。
豆包視覺理解模型或加快多場景AI應用商業化:AI+電商/營銷,重點推薦匯量科技(01860)值得買,受益標的包括引力傳媒(603598.SH)、因賽集團(300781.SZ)、遙望科技(002291.SZ);AI+陪伴/玩具,重點推薦奧飛娛樂(002292.SZ),受益標的包括湯姆貓(300459.SZ);AI+教育出版,受益標的包括世紀天鴻(300654.SZ)、盛通股份(002599.SZ)、南方傳媒(601900.SH)。
風險提示:豆包大模型迭代速度不及預期;豆包AI應用商業化進程不及預期。