share_log

黄仁勋最新对话:未来互联网流量将大幅减少,计算将更多即时生成

黃仁勳最新對話:未來互聯網流量將大幅減少,計算將更多即時生成

騰訊科技 ·  06/17 20:59

來源:騰訊科技

要點:

1、黃仁勳強調生成式AI正以指數速度增長,企業需要迅速適應並利用這一技術,而不是觀望,以免落後於技術發展的步伐。

2、黃仁勳認爲開源和閉源AI模型將共存,企業需要利用各自的優勢,推動AI技術的發展和應用。

3、黃仁勳提出,AI的發展需要考慮能源效率和可持續性,通過優化計算資源的使用和推動AI模型的推理與生成能力,減少能源消耗,實現更環保的智能解決方案。

4、隨着數據的不斷積累和智能技術的不斷進步,客戶服務將成爲企業實現智能化轉型的關鍵領域。

據國外媒體報道,在近日舉行的2024年Databricks Data + AI峯會上,$英偉達 (NVDA.US)$創始人、CEO黃仁勳與Databricks的聯合創始人、CEO阿里·戈德西(Ali Ghodsi)進行了一場精彩對話。雙方的對話展示了人工智能和數據處理技術在現代企業中的重要性和發展趨勢,強調技術創新、數據處理能力和能源效率在推動企業轉型和行業發展中的關鍵作用。

黃仁勳在對話中展望了數據處理和生成式人工智能的未來。他指出,每家公司的業務數據都如同一座未被充分挖掘的金礦,儘管蘊藏着巨大的價值,但要從中提取深刻的洞察力和智能一直是一項艱鉅的任務。

黃仁勳還談到開源模型如Llama和DBRX正推動企業轉型爲AI公司,激活全球AI運動,促進技術發展和企業創新。通過這次英偉達與Databricks的合作,兩家公司將攜手發揮各自在加速計算和生成式人工智能領域的專長,共同爲用戶帶來前所未有的好處。

以下爲對話實錄:

主持人:我非常激動地向大家介紹下一位嘉賓,他是一位無需任何介紹的傑出人物--全球獨一無二的“搖滾巨星”CEO——英偉達CEO黃仁勳。請上舞臺。非常感謝你的到來!我想先從英偉達令人矚目的業績談起,貴公司市值高達3萬億美元。五年前你是否曾想過世界會如此迅速地演變,展現出今天這樣一幅令人矚目的景象?

黃仁勳:當然!我從最初就預料到會這樣。

主持人:真是令人讚歎。能否爲臺下的CEO們提供一些建議,我們應該如何實現目標?

黃仁勳:無論你決定做什麼,我的建議是不要涉足圖形處理器(GPU)的研發。

主持人:我會告訴團隊我們不打算涉足這個領域。我們今天花費了許多時間深入討論了數據智能的深遠意義。企業手中握有海量的專有數據,這些數據是構建定製化人工智能模型的關鍵。這些數據的深度挖掘與應用對我們至關重要。你是否也注意到了這一行業趨勢?是否認爲我們應當在這一領域加大投入?你是否收集到了業界對此問題的聲音和洞見?

黃仁勳:每家企業都像擁有一座金礦,掌握着豐富的業務數據。如果你的公司提供了一系列服務或產品,並且客戶對這些服務和產品感到滿意,同時提供了寶貴的反饋,那麼你已經積累了大量有價值的數據。這些數據可能涉及客戶信息、市場動態或供應鏈管理。長期以來,我們都在收集這些數據,擁有龐大的數據量,但直到現在,我們才真正開始從中提煉出有價值的洞見,甚至是更高層次的智能。

目前,我們對此充滿激情。我們在芯片設計、缺陷數據庫、新產品和新服務的創造,以及供應鏈管理中都運用了這些數據。這是我們首次採用以數據處理和精細化分析爲起點的工程流程,通過構建學習模型,然後部署這些模型,並與數據收集的Flywheel平台相連,以獲取更多的數據。

我們公司正通過這種方式,使我們能夠躋身於世界上最大的公司之列。這當然得益於我們公司大量採用人工智能技術,這些技術幫助我們完成了衆多令人矚目的成就。我相信,每家公司都在經歷這樣的變革,因此,我認爲我們正處在一個非凡的時代。這個時代的起點是數據,以及對數據的積累和有效利用。

開源與閉源的和諧共存

主持人:這真是太令人讚歎了,非常感謝。目前,關於閉源模型與開源模型之間的辯論正逐漸升溫。開源模型是否能夠迎頭趕上?兩者是否能夠共存?或者最終是否會被一個單一的閉源巨頭所主導?你對整個開源生態系統有何看法?它在大語言模型的發展中扮演了怎樣的角色?未來又將如何發展?

黃仁勳:我們需要前沿的模型,尤其是那些能夠開拓視野的先進模型。OpenAI和谷歌在這方面的工作至關重要,它們不僅拓展了技術邊界,還幫助我們探索了新的可能性。然而,如果審視今年的情況,可能最重要的事件都與開源緊密相關,比如Llama 2、Llama 3、Mistral,以及Databricks團隊所開展的DBRX項目。

DBRX確實是非常酷的成果。它的酷之處在於,它激發了每一家企業的活力,使得任何一家公司都有可能轉型爲一家人工智能公司。你一定也注意到了這一點,我們在全球範圍內都看到了這樣的趨勢。我們最近將Llama 3轉化爲了一個推理微服務,並且現在可以下載使用。你可以訪問Hugging Face,當然還有Databricks,現在它已經被全球數百家公司所採納。

這充分說明了開源激發了每一家公司的潛力,讓它們有機會成爲人工智能領域的一份子。在英偉達,我們廣泛地使用開源模型,並結合我們自己的數據和技能,對它們進行微調和訓練。如果沒有開源,就不會有這場激勵全球每一家公司向人工智能轉型的運動。我認爲,這無疑是一件具有重大意義的事情。

主持人:確實,這是一個令人讚歎的發展。開源與閉源模型將共存,我們確實需要這兩種模式。您提到的Nim框架,即Nims,正是我們所關注的。我非常興奮地在這裏宣佈,我們將把DBRX集成到Nims中,並在Databricks平台上提供服務。事實上,我們未來開發的所有新模型也將採用這種方式。我們對Nims的前景充滿期待。

黃仁勳:創建大型語言模型API的過程確實是一項技術挑戰。儘管這些模型在當前看來可能不算龐大,但它們在計算上依然非常複雜,技術棧涉及衆多依賴項。爲此,我們開發了英偉達推理微服務Nim,它整合並優化了所有必要的依賴項。英偉達擁有專業的工程師團隊,他們專注於這一領域,將複雜的技術封裝成易於使用的微服務。

用戶可以在Databricks平台上輕鬆使用這一服務,也可以下載並根據需要進行個性化微調。英偉達NeMo(更新版本的神經模塊)微服務提供了這種靈活性,確保它能夠在任何雲環境或本地環境中運行,真正實現了無處不在的人工智能能力。

主持人:這確實是一項令人讚歎的技術。能夠在本地部署運行的能力尤爲突出,它意味着我們不再完全依賴雲服務,這無疑是一項巨大的進步。在與客戶的交流中,我們發現他們正致力於培養內部專業技能,以定製模型並獲得競爭優勢。對於這一現象,你有何看法?

黃仁勳:我認爲,未來的趨勢是,正如我們今天所見證的,我們已經能夠將幾乎所有類型的信息和數據進行標記化處理。我們能夠提取其結構、理解其內涵,並學習其表示,無論是聲音、語言、圖像、視頻,還是化學物質、蛋白質,甚至是機器人的動作控制或駕駛操作,我們都能夠進行標記化。

由於雲數據中心正在生產這些標記,我們實際上是在製造一些前所未有的獨特產品。這是首次,我們擁有了被稱爲人工智能超級計算機的工具,它們在專門爲此目的設計的工廠中生產標記,我們大規模生產智能的能力是一項全新的技術。這也是我堅信我們正處於一場新工業革命的開端的原因之一,這場革命不是生產電力,而是生產智能。

當然,每家公司在其核心都是關於特定領域的智能。在數據、數據處理、人工智能及其基礎設施方面,很少有公司能比Databricks擁有更深入的了解。我們專注於我們的專業領域,我們的基礎是這種特定領域的智能,無論是金融服務還是醫療保健等各個領域。最終,我們所有人都將成爲智能製造商。

如果你今天要成爲智能製造商,你將來會有人工智能領域的人力資源,我們稱之爲人工智能工廠。因此,每個公司都必須開始這一進程。我們正在這樣做,你也將這樣做。我們觀察到,無論公司規模大小,它們都在朝着這個方向努力。因此,在未來,我們所有人都將參與到這一進程中。你將從你的特定領域數據開始,這些數據存儲在Databricks的某個地方,你將處理這些數據,提煉並從中提取智能,然後將其放入Flywheel平台中,你將擁有一個人工智能工廠。

加速計算與生成式AI的融合

主持人:這確實是一項令人讚歎的成就,我對此深信不疑。我們對此充滿熱情,尤其是在數據處理方面。我們Databricks每天處理的數據量極爲龐大,大約每天4000萬億字節。

黃仁勳:這無疑是目前地球上最大的計算需求之一,也就是所謂的數據處理。事實上,幾乎每一家企業都在進行這項工作。

主持人:確實,數據處理的高並行性使其成爲我們重複執行相同操作的理想領域。我對於我們能夠攜手合作,將GPU加速技術引入數據處理充滿期待。我們致力於在覈心數據處理領域實現與AI模型相媲美的革命性進步。我們對與您攜手,利用GPU加速技術優化我們的Photon引擎,以邁入將GPU應用於核心數據處理的新時代感到無比激動。目前,這些龐大的工作流程不得不依賴CPU來執行,我們期望它們也能在Nvidia GPU上高效運行。

黃仁勳:順便提一下,這是一個重大的消息:當今計算領域的兩大關鍵趨勢--加速計算和生成式人工智能,Nvidia和Databricks將強強聯合,匯聚我們在這些領域的專業技能,將這些前沿技術帶給每一位用戶。數據處理的加速雖然在技術上極具挑戰,但我們已經投入了五年的時間,不懈努力,終於開發出了能夠顯著提升Photon性能的庫。這是我們長期努力的成果,現在我們將使Photon加速,讓數據處理變得更加迅速、成本效益更高,並且非常重要的是,顯著降低能源消耗。

主持人:這確實是一個意義深遠的進展,它在邏輯上非常合理。儘管數據處理過程複雜且充滿特殊情況,但由於其高度的可並行性,我們實際上並不需要通用的計算能力。我們面對的是重複性極高的操作,處理的是龐大的數據集,而不是獨一無二的數據。因此,我對這項技術充滿期待,它不僅具有顛覆現狀的能力,還將大幅提升性能,降低成本,這無疑將帶來令人驚歎的變革。

黃仁勳:當我們能夠迅速處理海量數據時,研究人員便有可能在某個清晨醒來,突發奇想地說:“讓我們收集互聯網上的所有數據來訓練一個龐大的模型,因爲現在這已不再是耗時費力的工作。”若非加速計算技術的發展,人們不會考慮這樣的想法,因爲那將成本高昂且耗時漫長。但現在,這已成爲可能,我們能夠以更低的成本和更高的效率處理前所未有的數據量。這將激發出無限的創新思維,比如:“讓我們利用公司的全部數據來訓練我們的超級人工智能,”這樣的日子即將到來。

開啓智能服務的新篇章

主持人:的確,將整個互聯網的數據進行處理,這曾是一個只存在於科幻小說中的概念。我們曾認爲這是不可能實現的,直到硬件和基礎設施發展到足夠先進的水平,使得我們能夠對技術進行專門化處理。如今,這已成爲現實,每個人都在參與其中。讓我們轉向另一個話題。生成式人工智能的蓬勃發展確實令人矚目。

起初,衆多企業以聊天機器人爲起點,致力於開發和定製基於自身數據的聊天機器人。然而,目前我們觀察到人們正逐步拓展至更多尖端的應用場景。展望未來,人工智能的哪些新應用最令你感到興奮?

黃仁勳:在所有潛在影響中,客戶服務可能是最爲深遠的領域。對於在座的每家企業而言,客戶服務涉及的開支高達數萬億美元,橫跨每一個行業,每一家企業。聊天機器人在客戶服務中的應用,其重要性不僅在於自動化能力,更在於其對數據飛輪的貢獻。企業需要捕捉對話,將客戶互動納入數據體系,這無疑將產生大量數據。

目前,數據量的增長速度大約是每五年增加十倍。鑑於客戶服務的推動,我預計未來數據量的增長速度可能達到每五年百倍。我們將把所有元素整合入數據飛輪,它將收集更多數據,提煉更深層次的洞察,從而提取更精準的智能信息,提供更優質的服務,甚至實現在問題出現前的主動預防和解決,類似於預防性維護,我們將實現主動式客戶支持,這將進一步推動數據的生成和飛輪的旋轉。因此,我認爲客戶服務將是大多數公司實現超級加速的關鍵,尤其是考慮到它將收集的數據量。

我們已經實現了對一切事物的數字化標記,我對我們在化學、蛋白質、碳捕獲材料、酶、以及創新電池等領域的進展感到興奮。我們還利用生成式人工智能實現了區域天氣預報的精確度,在以往,這需要超級計算機的計算能力才能達到。物流、保險、以及保護人們免受傷害的能力都將因此得到提升。

此外,生成式人工智能在物理、生物領域,以及3D圖形、數字孿生、視頻遊戲虛擬世界構建等方面也展現出巨大潛力。如果貴公司尚未涉足生成式人工智能,那可能是因爲尚未充分關注。事實上,它已經滲透到了每一個行業。

主持人:我完全贊同你的觀點,人工智能的應用無疑將遍佈各個領域,這不僅合理,更充滿無限可能,令人充滿期待。面對這些新興的前沿領域,我們對數據的需求正日益增長。關於如何幫助企業實現更可持續的人工智能發展,您有何看法?

黃仁勳:可持續性可以從多個角度來考量,尤其是與能源相關的方面。值得注意的是,人工智能本身並不挑剔其“學習”的地點。我們沒有必要將人工智能的訓練數據中心設立在那些電網已經承受壓力的人口密集區域。恰恰相反,我們可以將它們安置在能源充足且分佈均勻的地區。

全球能源資源十分豐富,關鍵在於如何合理分配和利用。因此,我認爲這是我們首次有機會捕獲並利用那些過剩的能源,將其轉化爲人工智能模型的動力,並最終將這些智能成果回饋給社會,服務於我們的實際需求。

另一個重要的視角是,人工智能的核心不僅僅在於模型的訓練,更在於其推理和生成能力。我們訓練模型的最終目的是爲了應用它們。當我們着眼於人工智能的長期效益時,以我先前提及的利用人工智能進行天氣預報爲例,我們不再需要每次都從頭開始模擬物理定律,而是可以通過人工智能來生成預測結果。這種方法不僅縮短了預測時間,提高了預測精度,更在能源消耗上實現了數千倍的降低。

此外,人工智能的縱向效益還體現在其他方面,例如通過一次性訓練模型來設計手機芯片,從而爲所有用戶節省能源。我相信,隨着時間的推移,人工智能將展現出其在節能方面的潛力。

最後,關於生成式人工智能,今天的計算體驗大多是基於檢索的。每次我們點擊手機,雖然看似消耗的能量不多,但實際上它激活了全球的API,檢索信息,點亮了互聯網,然後從不同的數據中心收集少量信息,通過推薦系統呈現給我們。未來,隨着設備上運行的小語言模型變得更加上下文化和生成化,互聯網流量將大幅減少,計算將更多地即時生成,這將極大地節省能源,使計算模型發生根本性轉變。

通過這種方式,我們不僅能夠節省大量能源,還能更高效地獲取答案。這將徹底改變我們的計算方式,使我們能夠更快地提出問題,得到答案,從而激發出更多有趣的問題。這種與人工智能合作的未來,將是一個充滿提示和啓發的新時代。

主持人:是的,未來非常激動人心。好的,我最後一個問題是,我們如何幫助客戶,也就是在座的各位,今天就開始行動?最好的方法是什麼?

黃仁勳:我之前提到過,我認爲Databricks從數據處理擴展到數據治理,再到數據存儲,然後將其縱向擴展到從數據中提取智能,這一轉變是非常有遠見的。我未能記起她的名字,但毫無疑問,那位“Cookie女士”的工作表現極爲出色。是Casey吧?請別讓她被其他公司挖走,她剛才在後臺的演示確實令人印象深刻。我被她的演示深深吸引,儘管在後臺有許多交流的機會,但我個人更傾向於全神貫注地觀看她的演示。

她對數據智能平台的掌握和展示技巧,無疑值得我們的高度讚揚和尊重。我認爲這個平台非常了不起,你們讓人們更容易地管理數據、提取信息、處理數據。數據整理在模型訓練中仍然是一個非常重要的部分。人們談論模型訓練,但在訓練模型之前,你必須弄清楚哪些數據是正確的。這關乎數據質量、數據格式、數據準備。所以,我認爲開始的方式是來到Databricks,使用Databricks的數據智能平台。我說的對嗎?

主持人完全正確。

黃仁勳:確實,沒有人會反對將他們的平台命名爲DIP,即數據智能平台(Data Intelligence Platform)。這個名稱既響亮又富有內涵,我對此十分讚賞。它與Nims一樣,都是令人印象深刻的命名。你完全可以同時使用這兩者,無需做出選擇。獲取一個Nims加上DIP,我完全贊同這種結合使用的方式,這是一個明智的策略。

無論你計劃做什麼,關鍵在於立即開始行動。你必須積極參與進來,投身於這趟迅猛發展的列車之中。切記,生成式人工智能正以指數速度增長,你不應僅僅觀望或等待。指數趨勢的發展速度是驚人的,幾年之內,落後者將被遠遠拋在後面。因此,立即加入這場技術革命,隨着技術的不斷進步,你也將隨之學習和成長。這正是我們所採取的行動方式。

這是一個不應通過旁觀來學習的過程,你不能僅通過閱讀來掌握它,真正的學習來自於親身實踐。正如我們所做的,全身心投入其中。

主持人:非常感謝。這是一條寶貴的建議。過去十年的合作令人難忘,感謝你所做的一切。我們一直是出色的合作伙伴,期待與Databricks共同迎接下一個十年的輝煌。

編輯/tolk

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論