share_log

声网(API.US)发布Q3财报,总营收3157万美元,持续聚焦RTE+AI技术深耕

聲網(API.US)發佈Q3業績,總營收3157萬美元,持續聚焦RTE+AI技術深耕

智通財經 ·  11/26 09:31

聲網母公司 Agora, Inc.發佈了2024年第三季度業績。業績顯示,第三季度 Agora, Inc. 實現總營收3157萬美元

北京時間11月26日,聲網母公司 Agora, Inc. (API.US) 發佈了2024年第三季度業績。業績顯示,第三季度 Agora, Inc. 實現總營收3157萬美元,其中,業務聚焦在中國市場的聲網實現 Q3 營收1.13億人民幣。聚焦非中國市場的 Agora 實現 Q3 營收1570萬美元。

在資金儲備方面,業績顯示截至2024年9月30日,Agora, Inc. 現金、現金等價物、銀行存款及理財產品3.63億美元。

「近期,Agora推出了 Conversational AI SDK,並與 OpenAI Realtime API 合作,讓開發者能夠在任何應用程序中加入語音驅動的對話式 AI 能力。」Agora, Inc. 創始人兼 CEO 趙斌表示,「我們相信,能以語音與人類進行自然對話的多模態 AI 將在客戶服務、教育和健康等多個場景中得到廣泛應用,而我們有望成爲對話式 AI 的關鍵基礎設施。」

「爲了支持這一願景,我們進行了一些組織調整,旨在打造一個更高效、更靈活的組織,讓我們能更敏捷的抓住市場機遇,並打造生成式 AI 時代的下一代實時互動技術,鞏固我們在實時互動領域的領導地位。」趙斌稱。

RTE成AI Infra關鍵部分,聲網發佈 RTE+AI 能力全景圖

在10月25日舉辦的第十屆實時互聯網大會上,聲網正式發佈了 RTE+AI 能力全景圖,從實時 AI 基礎設施、RTE+AI 生態能力、聲網 AI Agent、實時多模態對話式 AI 解決方案、RTE+AI 應用場景五個維度,清晰呈現了當下 RTE 與 AI 相結合的技術能力、架構方案與應用場景。RTE 已經成爲生成式 AI 時代 AI 基礎設施的關鍵部分,而 RTE 與生成式 AI 結合所帶來的場景創新,也將成爲下一個十年的主題。

big

幾年前,聲網在業內首次將 AI 算法全面引入 RTC 技術棧的各個領域,用於改善音視頻體驗與 QoE 體驗。在音頻領域,聲網打造了新一代實時音頻技術智能引擎「鳳鳴AI引擎」,其中的 AI 降噪、AI 回聲消除、空間音頻等能力給實時互動場景帶來了更加純淨和沉浸的聽覺體驗。在視頻領域,聲網的「實時高清·超級畫質」解決方案,在全面提升視頻畫質的同時,也帶來了 AI 美顏、虛擬背景、AI 驅動表情與動作等方面的體驗進化。

生成式 AI 正在向多模態和多步推理兩個方向深度進化。其中,多步推理對於延遲降低和可用性的穩定保障成爲關鍵需求。聲網首創了迄今爲止規模最大的實時音視頻網絡——軟件定義實時網SD-RTN。SD-RTN 將爲分佈式多步推理的延遲控制提供重要保障。其對傳輸質量的保證以及穩定可靠的支持,也將在生成式 AI 時代成爲不可或缺的網絡基礎設施。

在基礎設施之上,本季度聲網通過與多家客戶在 AIGC 場景的深度合作,探索出了實時多模態對話式 AI 解決方案,該方案以語音爲核心,支持視頻擴展,可實現文本/音頻/圖像/視頻的組合輸入&輸出,通過豐富的功能構建真實、自然的 AI 語音交互體驗。

big

實時多模態對話式 AI 解決方案具備四大優勢:對交互延遲進行優化,延遲可做到低於500ms;支持 AI 降噪、背景人聲過濾,讓語音對話更純靜;支持隨時打斷與超擬人化人聲合成,讓對話更智能與逼真;同時還支持靈活可擴展的 AI Agent 架構等一系列功能,幫助開發者與企業快速構建適配自己業務場景的 AI 實時語音對話服務。

創新AI+會議協作、智能硬件場景,互動體驗全面升級

聲網作爲全球實時互動雲服務行業的開創者,一直在探索生成式 AI 與 RTE 結合爲各個行業帶來的體驗提升和場景創新。本季度,聲網正式發佈了 aPaaS 產品「靈動會議」,通過 RTE 技術與生成式 AI 能力的融合,重塑會議協作使用體驗,爲客戶提供低代碼視頻會議平台,並且採用了多雲、多平台設計,提供 SFU+MCU 混合架構部署能力,支持客戶進行靈活部署和擴展,全面滿足客戶會議、協作和調度需求。

big

RTE 技術確保了低延遲、高質量的音視頻傳輸,讓視頻會議溝通更加實時流暢;而生成式 AI 則通過對會議內容的分析和生成,提供智能化的輔助功能,如實時字幕、AI 會議紀要等。兩大技術支撐,讓會議從傳統的信息傳輸工具升級爲智能協作平台,有效提升了會議效率和用戶體驗。

除此之外,在實時多模態對話式 AI 解決方案的基礎上,聲網針對 IoT 行業的特殊性,探索出了 AI x IoT 智能硬件解決方案,該方案能夠在低功耗、低算力芯片上快速實現大模型的接入,具備低延時實時互動、低成本靈活適配的特性,通過豐富的功能在智能硬件場景中構建真實、自然的 AI 語音交互體驗。

目前多模態大模型在智能硬件場景的落地主要以智能眼鏡、智能手錶、智能耳機等穿戴式設備爲主,在生成式 AI 的趨勢下,還出現了智能陪伴機器人、智能兒童毛絨玩具、智能戒指等一系列場景,帶來不同硬件終端下的 AI 語音交互體驗。

RTE 產品更加專業化,推出Status Page、VoIP CallKit

本季度,聲網的 RTE 產品也正朝着更加專業化的方向邁進。趙斌在 RTE2024 的演講中提到,聲網推出了面向實時互動的 Status Page,它提供了電信級質量保證,擁有分鐘級更新質量保證狀態的能力。同時,針對實時互動對話中的卡頓、延遲等體驗,提供更加細緻且清晰的指標,幫助開發者和客戶更好地對實時互動服務狀態和能力進行感知。

針對泛 IPC 場景中,用戶接通率普遍較低這一痛點,聲網在近期推出了小程序 VoIP CallKit,該方案基於聲網 RTSA 音視頻實時通話服務,可支持微信小程序 VoIP 端到端呼叫功能。可適用於帶屏 IPC、智能門鎖、陪伴機器人、智能可視檯燈、智能手錶、智能帶屏音箱等一系列 IoT 場景。 在這些場景中,接入 VoIP CallKit 能夠高效、快速、準確地實現智能硬件與微信小程序之間的 1v1 實時音視頻通話。

今年8月,中國首款 3A 遊戲「黑神話:悟空」 的推出使得遊戲開黑業務呈現爆發式增長,爲了吸引更多觀衆參與,直播時的畫質成爲直播平台和主播都非常關注的因素。聲網的遊戲直播方案,通過對採集和編碼側的核心技術優化,在遊戲屏幕共享過程中,保證實時視頻編碼,讓性能消耗最低、編碼效率最高,最終實現不掉幀、無卡頓、低延時、超高清的遊戲直播互動體驗,可以真正做到把大片級 4K 60幀觀看體驗搬到普通玩家的日常遊戲直播中。

聲網研究院出品,《讀懂實時互動》新書重磅發佈

今年是聲網成立10週年,聲網一直以「幫助人們跨越距離實時互動,如聚一堂」爲使命,致力於通過高質量的實時音視頻技術服務,全面提升人們的實時互動體驗,爲社交、教育、金融、醫療等行業賦能,推動經濟、社會的發展。聲網有責任也有義務去推動實時互動的普及。

對此,聲網在10週年之際推出《讀懂實時互動:音視頻技術、場景及數據深度解讀》一書。本書由機械工業出版社出版,聲網研究院組編,於8月27日正式發售上架,這也是全行業首本系統介紹實時互動的技術型科普圖書。

big

《讀懂實時互動》從發展歷程、技術原理、應用場景、大數據觀察等多個維度對實時互動行業展開全面的系統性講解。聲網希望讀者通過閱讀本書,能夠深入的讀懂實時互動,並掌握實時互動相關的知識,並推動更多的人群加入到這個行業中來,一起推動行業的進步。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論