• 瀏覽: 40
[隱藏]
作者 | Timothy Prickett Morgan

譯者 | 核子可樂,劉燕

偉大的技術人員總是著眼於未來,在無數工程師的協同努力下把前景轉化為現實。也正是這種從願景到規範、由規範到現實、再由現實到收益的重複迴圈,推動世界不斷進步。

過去十五年來,英偉達就一直身處這種從創造到擴張的良性迴圈當中。近日,The Next Platform 記者 Timothy Prickett Morgan 專訪了英偉達聯合創始人兼 CEO 黃仁勳,探討了資料中心的後續發展,以及 Omniverse 這一融合了模擬、人工智慧、增加現實與虛擬現實技術的最新專案將如何改變現實世界的性質與其中的計算方式。

以下是對話全文,由 AI 前線小組編譯:

在元宇宙裡造第二個地球

記者:我還是更喜歡真實的現實;對虛擬現實興趣不大,增強現實也只是稍好一點。但在今年春季的 GTC 大會上,我看到了未來寶馬工廠的概念視訊,並最終折服於 Omniverse 堆疊的強大潛力。我終於理解了數字孿生的真正含義,破除了我自己乃至整個業界經常出現的錯誤理解。在我看來,真正的數字孿生是把遙測推廣至每個角落,再用計算裝置將遙測結果疊加到真實世界之上,進而利用這些資訊達成效能。

所以我的第一個問題是:Omniverse 成功的機會有多大?

之前英偉達加速計算總經理 Ian Buck 曾經向我解釋過,超級計算機中心的高效能運算(HPC)與超大規模計算機的 AI 及資料分析各自孤立存在,而 Omniverse 最重要的現實意義就是把這些成果統一起來、以單一堆疊的形式推向商業化。我認為其中的設計思路相當深刻。在這些分散孤島的支援下,您已經建立起年收入高達 100 億美元的資料中心業務,而且增長態勢一直良好。Omniverse 的出現會進一步推動英偉達的資料中心業務嗎?

黃仁勳:是的,你的理解很中肯也很準確。如你所見,我們要做的不是給地球加上一個“疊加層”,而是數百萬個疊加層、數百萬個孿生宇宙。有些由人工構建,有些由 AI 構建。其中一些 Omniverse 世界會模擬現實情境,也就是數字孿生;也有一些可能會跟客觀現實脫離。而且有些持久存在,有些則僅僅短暫維續,類似於超級計算機中的暫存器。

所有這些世界都將由統一的 AI 計算系統驅動和處理,由它幫助我們管理所能感知到的視覺、感測器、物理以及自動化智慧等資訊。總結來講,未來的資料中心將類似於孿生宇宙的引擎,所以我們也在著力構建 Omniverse 伺服器與 Omniverse 資料中心。

事實上,英偉達希望在 Omniverse 世界中邁出的第一步將是“地球 2 號”(Earth-2)。這將是一臺規模極大的超級計算機,主要用於模擬地球氣候變化。有了這樣一套能夠評估應對策略的測試系統加早期預警系統,我們將為全人類的氣候變化預測做出重大貢獻。

大家都知道,全球平均氣溫每上升 1.5 度都會帶來驚人的變化。氣溫波動本身帶來的體感影響還在其次,更重要的是近年來的颶風、龍捲風、強風暴乃至洪水——包括作為全球最大淡水生態體系之一的湄公河竟然變成了鹹水河——可能都與這種波動有關。所以我們希望能為這顆瞬息萬變的蔚藍星球建立一套模擬引擎。

你應該可以想象一大堆 Omniverse 引擎持續模擬各種宇宙的情景了吧,這也是專案令人興奮的原因所在。而我們之所以有信心實現這一切,是因為英偉達內部一直在不斷推進模擬的邊界。我們能夠模擬內部晶片架構,也應該可以在未來到來前做出準確預測。

記者:這樣一來,我們就能提前預見未來的狀況。

黃仁勳:沒錯。所以我們才積極把這些技術引入目前最具挑戰的現實問題當中——預測未來、探索邊界、理解當前決定對整個地球的影響,而且相應的週期可能長達三十年、四十年甚至七十年。長期以來,氣候變化之所以很難在全社會中引起共鳴,就是因為大部分人不關心、也感受不到來自七十年後的壓力。

記者:很高興能在有生之年看到這一切的推進。兩年前新冠疫情還沒爆發時,極端氣候就已經在全球各地頻繁出現,就連我自己的房子都受到影響。今年夏天,我家附近 10 英里範圍內甚至出現了龍捲風。

黃仁勳:已經有一些人開始意識到並接受這樣的現實。當然,也有人覺得極端天氣總會出現,沒什麼可大驚小怪的。但無論如何,我們都有必要模擬整個氣候系統,讓“總會出現”變得“可以解釋”。

記者:但你覺得這真的現實嗎?或者說,人們真的會在乎嗎?就算是把幾十年後的未來擺在大家面前,很多人恐怕也會無動於衷吧?

黃仁勳:但我仍然希望能帶來哪些一點點觸動。如果他們能像英偉達一樣相信模擬的力量——我們始終堅信這一點,而且在模擬領域的投入遠超他人——就應該相信模擬得出的結果能夠指導我們採取行動、修復氣候問題。

記者:在三年前的 SC19 大會上,我曾動筆寫過一篇題為《模擬出的未來,就是我們相信的未來》的文章,可惜一直沒有最終完成。我一直想不到合適的收尾,但現在我好像有點感覺了……

黃仁勳:明白了,是的,你已經理解了我想表達的東西。

記者:如果我們相信模擬、同時把這種相信付諸模擬,那麼大家肯定就要關心這些資訊到底是怎麼處理的。在這件事上我自己也很糾結,一邊我希望外行人能閉嘴、少對自己不懂的東西指手畫腳。但必須承認,事情不可能就這麼簡單粗暴地推進,我們必須找到合適的平衡點。你肯定也很清楚,技術永遠是把雙刃劍。

黃仁勳:沒錯,我認為大多數人——雖然不是所有人——只要能夠理解自己行為帶來的後果,還是會做出正確選擇的。真正的問題其實是那些我們設想不到的問題,例如我們無法對未來人類活動給自然環境造成影響後的真實體驗做出預設。

記者:那麼,模擬應該就是個很好的展現方式。

黃仁勳:這就是“地球 2 號”的最大意義所在。地球 2 號可以說是數字孿生領域最直觀、最有力的功效案例。我們可以將同樣的概念引入工廠流水線、也可以引入 Omniverse 虛擬世界中相互對接的自動駕駛車隊,還有機器人的數字孿生等等。想象一下,我們將為工廠設計出純數字版本的機器人系統,並在實際操作當中不斷改進這兩個孿生版本。虛擬世界中的優化效果也將照進現實世界,這正是 Omniverse 的意義所在。

資料中心業務如何提速

記者:下面咱們聊聊英偉達的資料中心業務吧。接下來業務要如何保持穩定的增長速度?或者說還可能迎來進一步提速?

黃仁勳:肯定還會進一步提速。

我們對資料中心業務的未來願景是,資料中心應該成為一種負責處理超大規模應用程式的計算引擎,同時結合從物理模擬到人工智慧、再到計算機影象的所有內容。

對於這樣一套資料中心體系,最擅長設計並構建它的肯定是我們。從這個角度來看,始終在物理、人工智慧與計算機影象領域貢獻獨特力量的 GPU 必然成為 Omniverse 世界的完美引擎, 只是這一次的規模將超越以往任何時候。

當下我們面對的問題多種多樣,有些可以被拆分成多個較小的部分來逐一攻克,但也有一些無法拆解、否則必然造成不可控制的失真。在這種情況下,我們只能選擇將規模可觀的負載整個執行在由超級計算機支撐的雲原生環境當中。我們正在努力解決一個個影響人類社會未來命運的問題。

目前業界已經有不少支援的聲音,認可英偉達將超級計算機轉化為雲原生系統的思路。另外,Omniverse 終究是要由成百上千萬人共享的,所以我們才需要研究 AR 與 VR 技術,它們是出入 Omniverse 的通道。AR 讓 AI 技術從 Omniverse 進入我們的現實世界,而 VR 則是把我們吸入 Omniverse 的“蟲洞”。

記者:有意思,這樣整個生態就形成了閉環。或者說,你把世界變成了各式各樣的電子遊戲。

黃仁勳:沒錯,但其中也有一些重要區別……

記者:但有一說一,好像你自己也沒想好具體該怎麼表達……

黃仁勳:是的是的,因為你比較熟悉技術背景,所以我在思考怎麼解釋更合適。

Omniverse 和電子遊戲引擎之間有著根本區別,這種區別在於 Omniverse 中的一切都是實時生成的,而電子遊戲裡的一切是預設好的。例如,看看當下的電子遊戲,就會發現資料下載量往往高達幾百 GB。原因很簡單,大部分紋理和照明設計都是預先烘焙好的,所以在呈現前需要進行離線渲染。

沒錯,目前電子遊戲中的幾乎所有內容都像電影那樣採用離線渲染方式。先是合成動態層,也就是光照層,之後是新增鏡面反射、動態照明等等,讓整個區域呈現出動態體驗。但這只是種感覺,實際上電子遊戲中的光照不會隨時改變,這也限制了遊戲中的實際環境。例如,建築物在倒塌時整個過程不會立即顯示出來,因為這會改變全域性照度分量,目前的遊戲還無法實時處理這樣的運算。

但在 Omniverse 當中,我們會從零開始構建一切,所以沒辦法預先計算光照。所以 Omniverse 的一切都會實時完成。這堪稱一大奇蹟, 例如扔下一個球,它會落在地上並反彈起來。對於不同材質的球,金屬球或者橡膠球,反彈時的性狀會由物理引擎來模擬。這些模擬全部實時完成,碰撞檢測也是,保證不同物體間不會相互滲透。另外,一切照明同樣實時完成。這就是 Omniverse 最令人嚮往的亮點。

記者:要實現這樣的核心差異,英偉達肯定能賣出很多算力資源吧。

黃仁勳:最重要的是先創造出這樣的未來,之後才是生意、賺錢。我們無法預判人們想買什麼、不買什麼。

我們堅信,Omniverse 首先能夠為之前提到的這些場景建立起模擬數字孿生版本,或者將不同的 3D 世界連線起來。所以我再舉個例子:到那時使用者也許會身處 Adobe 的世界,而且各自有自己的資料集與資料結構。Adobe 設計師將由此進入 Adobe 當中。當然,還會有 Dessault Systems 世界和 PTC 世界等等。如同網站與 HTML 連線,只要能通過某種標準將這些事物連線起來,我們就能透過單一門戶實現內容共享。

而英偉達的目標就是以 Omniverse 打造這樣的門戶,同時輔以通用場景描述(簡稱 USD),幫助每一位使用者看到裡面的東西、看到我們為這個數字孿生世界做出的貢獻。事實上,這個世界的建設需要我們每個人共同努力,相當於是 3D 版本的 Google Docs。

記者:這就像是《鋼鐵俠》電影裡出現過的情景。

黃仁勳:沒錯,有些人適合用 VR,有些人適合用 AR,但同處一個世界。

英偉達不是晶片公司,而是軟體公司

記者:我們再來聊聊產品策略吧。Omniverse Enterprise 的定價為每使用者 9000 美元,之前很少看到英偉達會明確對軟體收費。英偉達開發過不少軟體,不知道你們的內部開發資源有多少關注硬體、又有多少分給軟體?

黃仁勳:公司裡有四分之三的員工負責開發軟體。

記者:哇哦,這個比例確實不低,但英偉達的收入分配應該不是直接按比例劃分的吧?這種情況讓我想到了上世紀六十年代末期的經典 IBM,當時大型機主要靠硬體銷售,同時提供配套的軟體與服務。但隨著推移,摩爾定律推動硬體成本不斷下降,IBM 在競爭之下也開始走上硬體價格降低、軟體與服務價格 / 佔比上漲的道路,而系統的總體使用成本基本不變。英偉達也會走上同樣的道路嗎?

黃仁勳:我一直把英偉達的軟體視為有價值、而且對應直接回報的成果。英偉達一直在為軟體付費,這種思路跟蘋果 iPhone 差不多。雖然使用者買的是手機,但其中豐富的軟體無疑也是整個系統的重要組成部分。

在軟體定價方面,英偉達的唯一問題在於:我們該以怎樣的方式與客戶交換價值?或者再進一步簡化成,我們要如何為客戶提供一種最便捷的價值交換方式?

回顧過往的產品分銷方式,可以看到英偉達之前是需要分銷層才能對接終端使用者的,這是因為我們的技術被整合到了個人電腦、遊戲機或者伺服器當中。

對於硬體廠商來說,業務流程就只能截止於硬體的設計、構建和銷售。在理想情況下,客戶買了硬體之後就再也不跟廠商聯絡了——優秀的硬體就該有這樣的信心。但優秀的軟體則有不同的標準,它需要不斷升級、即時升級。而我們英偉達敢於做出這樣的承諾:只要我們還存在、還運營,我們就會一直保持升級。

很多 GeForce 客戶都對我們的服務感到意外,因為我們會年復一年不斷升級配套軟體。CUDA 客戶對於 CUDA 12 的良好口碑,也源自多年前的一次付費所換來的長久服務。我們從未停下過軟體堆疊的升級與加速腳步,這令很多使用者感到震驚。

可能不少朋友都有這樣的感受:在買下一臺裝有英偉達硬體的計算機後,時隔數年只要下載最新的驅動程式,它就能奇蹟般地實現提速。所以,我們提供的價值顯然主要體現在軟體身上。買到的硬體只是對應初始效能外加一定的效能上限,但在整個使用週期內使用者會逐步獲得 3 倍、4 倍甚至是 10 倍的後續效能提升,而且這一切只通過軟體更新就能實現。總而言之,軟體體現出我們看待這個世界的方式、反映出我們的運營戰略,也再次強調 28 年來英偉達始終強調的“我們是一家軟體公司” 的基本文化。

這就帶來了另一個問題:我們怎麼獲取回報?我個人認為這是兩個毫不相關的問題:怎麼賺錢跟使命定位完全不同。在賺錢方面,市場永遠是最公平的。

有些朋友可能會問:如果英偉達真的只靠賣顯示卡,那區區幾千美元的晶片回報怎麼能支撐起長久延續的軟體升級?當然不行,除非建立起真正的規模經濟效應。所以我們選擇了走量的業務模式,而非專為一部分高階客戶提供定製硬體。基於這種橫向思考,我們會慢慢擴大硬體裝機量、慢慢開發出順應市場需求的軟體,慢慢建立起堆疊與相應價值,並最終在各個領域中慢慢孕育出生態系統。

大家應該瞭解,CUDA 中的 UDA(統一裝置架構)是在 1995 年發明的,它出現時英偉達的很多現任員工甚至還沒上大學。以此為標誌,我們確定了建立橫向計算模型的運營思路,我們的整個商業模式也圍繞著這個原則擴充套件而來。

記者:您認為企業應該如何分配硬體和軟體支出?畢竟 Omniverse Enterprise 已經確定要收取合約和許可費了。

黃仁勳:企業客戶跟個人客戶的需求也有很大差別,這一點非常重要。企業要求我們給出明確的承諾:我們會按照特定的更新節奏不斷髮布迭代,甚至針對特定問題提供分叉版本或者向下相容功能;而企業客戶信任這些承諾,並以此為基礎構建其他軟體。所以要維持這樣的合作關係,英偉達就必須恪守承諾,甚至以有違內部發展策略的方式規劃並維持多代後續架構。

記者:是的,很多客戶最初是打算把某平臺用上十年,但最終可能只用了三年、也可能用了二十多年。

黃仁勳:確實是這樣。

記者:我們不應該束縛人們的思維,但實際運營中的這種堅持並不應該叫束縛,而是對投資和安全的尊重。

黃仁勳:畢竟企業要付錢,要簽訂一份非常具體的服務水平協議,並在其中明確表達他們的更新節奏與運營方式。而就算跟原本的工程計劃不符,我們英偉達也會按照商定的方式為企業客戶提供支援。企業軟體就是這樣,合作雙方必須建立起這種關係。我們還要給客戶以信心,讓他們知道只要他們打來求助電話,我們就會放下手頭所有工作跑去幫忙。他們用英偉達產品可不是為了玩遊戲,而是在商業市場上跟競爭對手真刀真槍地比拼。

所以我們就沿著這個思路推進,通過網路不斷提供軟體更新程式碼,並保持快速移動、快速創新,在尊重企業客戶現有方法和敏感性的前提下建立起完整的系統發展路線。我們的 Nvidia AI Enterprise 堆疊正是這樣創立而來,現在我們需要以此為基礎保持維護、排程與創新,提供向下相容保障與必要時的分叉支援——這就是企業軟體的運營常態。

每年都有“英偉達殺手”出現

記者:所以現在企業客戶至少能夠保證有兩年的 GPU、DPU 與 CPU 穩定服務週期。但很明顯,AMD 的“Aldebaran”Instinct MI200 系列 GPU 加速器展現了前所未有的市場競爭力。

這裡要強調一點,其中確實包含 2 個 GPU,AMD 打算通過單裝置上的雙 GPU 來“拉昇 K80”水準。靠著這樣的優勢,這款 GPU 已經在無數小型系統以及兩套百億億級超大規模系統中站穩了腳跟。根據既定節奏,英偉達要到明年才會釋出新一代 GPU 公告,但 AMD 來勢洶洶似乎不容小覷。另外,英特爾恐怕也會帶來一定程度的 GPU 競爭壓力,對嗎?

黃仁勳:首先,我們三方其實一直都存在競爭。所以也沒必要把 MI200 理解成第一個跳出來的英偉達“殺手”。畢竟每年都會出現所謂的“英偉達殺手”,已經見怪不怪了。

記者:我的意思是,這是英偉達在高階 HPC 與 AI 超級計算領域的首位強勁對手。過去十五年以來,英偉達在超級計算機 GPU 加速領域基本可以說是沒有敵手。

黃仁勳:確實,但造成這種現狀的理由也非常簡單。因為 HPC 系統只要求兩點——效能和價格。HPC 資料中心需要提前幾年簽定訂購合同,但要怎麼確定還不存在的硬體的具體效能?英偉達有靠譜的計算方程,能承諾也能做到,所以就這樣了。

記者:能不能具體說說?

黃仁勳:我們可以理解成這裡有個交易天秤,一端是 FP64 的峰值算力與記憶體容量,另一端則是美元。就是這麼個等式,誰能做優做到,誰就能拿下這部分市場。

記者:所以 AMD 要想翻盤,就得提升效能、降低價格?但他們目前好像正在這麼幹……

黃仁勳:所以問題就變成了我們怎麼看待這個世界,為什麼會出現如此激烈的競爭。加速計算領域的對抗甚至不能說是激烈,而是慘烈。我會做出具體解釋。

你可以造出世界上最強的晶片,然後把它插進計算機裡……但之後呢?要用它加速什麼?根本就沒有東西,怎麼談加速?

加速計算的困難之處,就在於它對軟硬體協同提出了極高要求。另外,摩爾定律的要求太過苛刻,即使是按下限來算也是相當困難。要想成為一家成功的加速計算廠商,我們需要隨著時間推移穩定提供遠高於摩爾定律的結果。

記者:多年之前採訪谷歌時,他們就說過每天都得超越摩爾定律才能保持穩定經營……

黃仁勳:當然,這裡面代表著巨大的工作量,不可能單靠編譯器就達成目標。整個堆疊都需要重構,所以我們必須先了解應用程式以及其中的演算法,之後提出新的庫乃至新的系統。完成之後,我們才能完成一次提交。

但這世界上有成千上萬的應用,對吧?有些人可能覺得現在有了深度學習,一切都能加速起來了。但實際情況沒那麼簡單,計算機視覺的架構就完全不同。可以說每種架構都獨一無二,每種演算法都有自己的特性,所以只能從應用本體出發、逐一重構整個堆疊。另外,還得跟開發商合作,說服他們參與到這場應用加速競賽中來。真的太難了。

所以在很長一段歷史時期中,只出現了 CPU 這一種計算架構。直到最近幾年,加速計算模式才真正普及開來。這一方面是因為我提到的整體堆疊的重構工作難度極大,另一方面也在於我們很難說服應用程式的擁有者也參與到加速中來。人們更願意等待摩爾定律從天而降發揮作用,到時候多加幾個節點就行了。

要做得更好,必須實現全棧覆蓋,必須針對各個領域開發出很多軟體。好在經過了近 25 年的努力,我們終於讓加速計算架構完成了基本普及,我們也對此感到成分榮幸。儘管如此,我們的競爭對手仍然什麼都不做,繼續依靠摩爾定律的“魔法”。

我們的資料中心業務總值約 100 億美元,大概佔全球資料中心市場份額的 5%;而另外 95% 的資料中心業務仍然圍繞 CPU 展開。這就是競爭,殘酷的競爭。

但在下一個全新計算世界中,我們需要解決的問題不再是除以 2 或者乘以 2 那麼簡單。人類有史以來第一次把多種事件中的全部變數集中起來,所以總體計算量可能增加上百萬倍。氣候科學界也承認,即使是在合理的規模下,解決一個小問題也往往需要上億甚至十億次計算。如果將精度再提升 50%,計算量還會爆炸式增長。模擬領域的物理量遵循的就是這種增長曲線,所以接下來需要關注的可以說是億倍級計算問題。

但也有意外之喜,就是 GPU 的普及推動了深度學習技術的大眾化,進而帶來基於物理原理的神經網路。你能設想一套遵循物理定律的神經網路嗎?它會從原理方程和自然觀察中學習物理知識,而且一切預測中的損失函式都受物理定律支配,所以不會出現莫名其妙的假想——比如有違能量守恆定律的結論……

記者:可能這樣的現實已經來到我們的身邊……

黃仁勳:是的,是的,所以才說這是個意外之喜。如果我們能讓神經網路遵循物理定律,那麼這類模型就會帶來令人難以置信的擴充套件效能。在 GPU 的加持下,這樣的神經網路可以持續擴充套件。事實上,GPU 加速已經讓物理效能提升了 20 到 50 倍,所以突然之間神經網路開始能夠掌握偏微分方程了。

接下來就是神經網路的規模擴充套件,目前已經出現了 1 萬到 10 萬倍區間的擴充套件案例——我們可以讓模型與現實世界中獲得的觀察資料保持同步。通過並行化調整,神經網路可以被分佈在 10000 到 20000 個 GPU 之上,真正實現億倍甚至十億倍擴充套件。

這樣的結果,正是英偉達提出的 Omniverse。它的出現,代表著我們正式向世界數字模擬的陣地發起衝鋒。如果能夠成功飛躍,人類對計算的理解也將徹底改變。其中最大的意義也在於此——電腦科學改變了演算法,而演算法如今又反過來改變著電腦科學。

https://www.nextplatform.com/2021/11/16/nvidia-ceo-on-competition-software-and-the-omniverse/



原文連結:https://inewsdb.com/數碼/黃仁勳談GPU大戰:每年都有“英偉達殺手”跳

inewsdb.com 日日新聞 . 掌握每日新鮮事



inewsdb.com 日日新聞 . 掌握每日新鮮事
[按此隱藏 Google 建議的相符內容]