英偉達CEO黃仁勛到訪中國,所過之處都是焦點,以至于有些原本的重點“失焦”了。
7月14日,英偉達宣布將恢復(fù) H20 在中國的銷售,并宣布推出面向中國市場的全新且完全兼容的 GPU。H20攫取了絕大多數(shù)的關(guān)注,因其直接與大模型訓(xùn)推相關(guān),且此前被美國市場封禁。
相比之下,黃仁勛推出了一款全新且完全兼容的 NVIDIA RTX PRO GPU,并宣稱該產(chǎn)品“是為智能工廠和物流打造數(shù)字孿生 AI 的理想選擇”, RTX PRO 是專業(yè)領(lǐng)域產(chǎn)品,用戶群相對小眾,因此沒有得到應(yīng)有的關(guān)注。
但在業(yè)內(nèi)人士看來,其重要性被大大低估了,畢竟值得黃仁勛都親自帶貨。據(jù)市場消息,該產(chǎn)品可能命名為RTX PRO 6000 D Blackwell,將于今年三季度啟動供應(yīng),到年底的出貨量目標(biāo)是 100~200 萬片,對應(yīng)價值約為數(shù)十億到上百億美元,比英偉達此前因H20被禁導(dǎo)致的45億美元資產(chǎn)減值還要多。
這款被H20遮住的RTX Pro,將如何影響市場?
聚焦數(shù)字孿生需求,卡位藍(lán)海市場
黃仁勛在接受媒體采訪時表示,本周是第三屆國際供應(yīng)鏈博覽會的開幕,供應(yīng)鏈涵蓋了機器人、智能工廠等復(fù)雜系統(tǒng)。我們推出RTX Pro正是為這些數(shù)字工廠、數(shù)字雙胞胎、機器人等應(yīng)用場景量身打造的。RTX Pro非常適合教機器人如何成為“機器人”,教智能工廠如何提高效率和質(zhì)量。因此,本周的博覽會是一個非常合適的時機來宣布這一產(chǎn)品。
他還提到,新的產(chǎn)品RTX Pro專為數(shù)字孿生應(yīng)用設(shè)計。數(shù)字孿生構(gòu)建的是一個虛擬世界,一個數(shù)字機器人。之所以需要數(shù)字機器人,是因為要通過在數(shù)字世界中訓(xùn)練,教會實體機器人如何出色完成任務(wù)。RTX Pro最初是為運行名為Omniverse的全新應(yīng)用平臺所打造,該平臺對數(shù)字工廠、智能工廠及機器人等領(lǐng)域至關(guān)重要。因此RTX Pro是獨一無二的創(chuàng)新產(chǎn)品,堪稱全球首創(chuàng)。
“在中國這篇機器人創(chuàng)新如火如荼、智能工廠建設(shè)方興未艾、供應(yīng)鏈體系極其完備的熱土上,RTX Pro必將大放異彩。對此我感到無比振奮。”他說。
正如黃仁勛所言,中國有廣闊且完備的制造業(yè),市場前景足夠誘人,這是英偉達推出RTX Pro的直接原因。
據(jù)IDC預(yù)測,2027年中國數(shù)字孿生市場規(guī)模將突破1200億元,年復(fù)合增長率達45%。其中,工業(yè)制造(汽車、電子、新能源)占比超60%,僅汽車行業(yè)就有超200家工廠計劃部署英偉達Omniverse數(shù)字孿生系統(tǒng),單廠投入從500萬到2000萬不等。
51WORLD AI平臺技術(shù)總監(jiān)王憶源對筆者表示,中國制造業(yè)正加速向“智能工廠”升級,數(shù)字孿生成為核心工具,RTX PRO特性正好匹配中國制造業(yè)升級中的數(shù)字孿生AI需求,工業(yè)制造(如汽車、航空)、建筑設(shè)計(BIM)、影視渲染等領(lǐng)域?qū)Ω咝阅?GPU 的依賴日益增強,尤其在 AI 與 3D 可視化融合的背景下,RTX PRO 系列持續(xù)獲得穩(wěn)定采購需求。
在AI 應(yīng)用方面,包括AI 推理、小模型訓(xùn)練、視頻生成、數(shù)字人、AIGC 等業(yè)務(wù),企業(yè)對具備通用計算能力的顯卡配置關(guān)注度顯著上升,RTX PRO 系列恰好滿足這些多樣化、復(fù)合型的算力需求。
“當(dāng)然,作為算力消耗者,我們也比較關(guān)注它的價格,更準(zhǔn)確的說是性價比。在獲得面向中國市場的全新RTX PRO 顯卡后,會馬上做一手評測,合適的話就可以展開部署,試試這款芯片到底能不能打。”
“我們非常關(guān)注這款芯片的落地時間。”王憶源表示,“比如實時渲染能力,支持構(gòu)建高精度工廠虛擬模型(如生產(chǎn)線、倉儲系統(tǒng)),需強大圖形算力;輕量AI推理:優(yōu)化能耗、預(yù)測設(shè)備故障等場景無需頂級訓(xùn)練芯片,RTX PRO的GDDR7顯存(帶寬1.1TB/s)與定制化AI核心正適配此需求。”
閹割版全功能GPU,但依然是優(yōu)選
英偉達在今年3月的GTC 2025大會上,推出了專為工作站和服務(wù)器設(shè)計的RTX PRO系列Blackwell專業(yè)顯卡,但此前該產(chǎn)品同樣不被允許出口到中國市場,第三方價格在8萬元左右。
一位算力產(chǎn)業(yè)鏈人士表示,原計劃采購高性能算力卡如H100的用戶正加速向 NVIDIA RTX 系列轉(zhuǎn)向,進一步推動 RTX PRO 在專業(yè)市場的接受度和采購意愿。
新一代RTX PRO具備NVIDIA 流式多處理器、第四代 RT 核心、第五代 Tensor 核心、更大、更快的 GDDR7 顯存、第九代 NVIDIA NVENC、第六代 NVIDIA NVDEC、第五代 PCIe、DisplayPort 2.1等特性,適合于需要處理大量數(shù)據(jù)、進行高強度計算的專業(yè)領(lǐng)域。
黃仁勛也提到,新的RTX架構(gòu)基于Blackwell,而之前的RTX架構(gòu)基于Hopper。實際上,我們稱它為Beta Hopper。這款新GPU不同于H20,它有計算圖形和光線追蹤(Ray tracing)功能。光線追蹤對于傳感器模擬非常重要,比如激光雷達、雷達和計算機圖形學(xué)。我們可以模擬數(shù)字工廠中的傳感器,或者自動駕駛汽車中的傳感器,或者機器人身上的傳感器。
“RTX Pro 具備 H20 和其他 AI 產(chǎn)品所不具備的能力,它是一款同時具備計算圖形和 AI 功能的產(chǎn)品,專為數(shù)字雙胞胎設(shè)計。在應(yīng)用中,我們有名為Omniverse的 AI 庫,所有操作都在Omniverse上運行。”他說。
RTX Pro是一款全功能GPU,既能支持圖形也能支持AI,而H20只適合AI計算,但是為了規(guī)避美國制裁風(fēng)向,RTX PRO通過剝離高帶寬內(nèi)存(HBM)、移除NVLink互聯(lián)技術(shù)等敏感模塊,嚴(yán)格符合美國出口限制,確保長期對華供應(yīng)合法性。
數(shù)字孿生本身也在朝著AI方向發(fā)展,王憶源介紹,以51WORLD的數(shù)字孿生AI平臺CLONOVA為例,核心在于“三維仿真場景”和“空間智能大模型”的結(jié)合,因此對芯片有三個方面的需求:
圖形渲染需求 :構(gòu)建高保真、物理真實的三維仿真場景,需要芯片支持強大的實時光線追蹤能力、高分辨率紋理處理能力和復(fù)雜的幾何渲染能力。
AI計算需求:產(chǎn)品核心為驅(qū)動空間智能大模型進行理解、分析、決策和交互,從而需要芯片具有支持海量的并行計算能力。
大容量顯存需求:三維仿真場景本身就是顯存消耗大戶,高分辨率的紋理、復(fù)雜的模型幾何數(shù)據(jù)(數(shù)百萬甚至上億個多邊形)、環(huán)境光遮蔽貼圖等都需要占用大量顯存。大模型更是顯存的吞噬者:語言大模型和視覺大模型的參數(shù)量動輒幾百億,模型本身就需要占用至少數(shù)十GB的顯存才能運行。
從RTX PRO的性能來看,RTX Cores (光線追蹤核心)專為實時光線追蹤設(shè)計,Tensor Cores (張量核心能以極高的效率執(zhí)行大模型的訓(xùn)練和推理任務(wù),CUDA Cores (統(tǒng)一計算核心)提供強大的通用并行計算能力,可以同時處理圖形渲染管線中的其他任務(wù)(如物理模擬、后處理)和AI計算中的輔助任務(wù)。
此外,RTX PRO系列顯卡提供了遠(yuǎn)超消費級顯卡(如GeForce系列)的大容量顯存。用戶可以在同一時間,將復(fù)雜的、城市級別的三維場景和參數(shù)量巨大的數(shù)字孿生AI模型同時加載到一塊GPU顯存中。
這避免了因為顯存不足而頻繁在系統(tǒng)內(nèi)存和顯存之間交換數(shù)據(jù),從而保證了交互的流暢性和實時性。沒有大顯存,要么只能用簡化的場景,要么只能用小模型,數(shù)字孿生AI平臺發(fā)揮將大打折扣。
競爭對手不及預(yù)期,英偉達生態(tài)延續(xù)強勢
黃仁勛透露,中國已有數(shù)百個數(shù)字孿生項目基于Omniverse開發(fā),覆蓋汽車工廠、光伏電站等場景。
RTX PRO作為硬件入口,可深度綁定用戶至英偉達生態(tài)。此外,中國150萬CUDA開發(fā)者中,大量人員已熟悉英偉達工具鏈。RTX PRO支持CUDA并行計算,能夠降低工業(yè)AI應(yīng)用開發(fā)門檻,延續(xù)開發(fā)生態(tài)黏性。
王憶源認(rèn)為,RTX Pro跟其他芯片一樣,更大的粘性在于軟件生態(tài),包括CUDA以及基于CUDA的各種深度學(xué)習(xí)庫,Omniverse協(xié)作與仿真平臺,以及基于Omniverse的IsaacSim具身智能仿真平臺。
51WORLD推出了專門面向智能輔助駕駛和機器人的仿真平臺SimOne, 可以作為國內(nèi)的替代品,不過底層也是基于D3D/Vulkan圖形API和CUDA,使用的也是NVIDIA的顯卡。
圖片系A(chǔ)I生成
如上算力產(chǎn)業(yè)鏈人士提到,從生態(tài)壁壘看,AMD的ROCm和Intel的oneAPI雖然在努力追趕,但在軟件的廣度、深度、成熟度和開發(fā)者社區(qū)規(guī)模上,與CUDA存在差距。絕大多數(shù)AI框架(PyTorch, TensorFlow)、科學(xué)計算庫和專業(yè)圖形軟件(Adobe, Autodesk等公司產(chǎn)品)都是優(yōu)先為CUDA進行深度優(yōu)化的。這意味著即使競爭對手的硬件在理論峰值性能上接近,其實際應(yīng)用性能也往往因為軟件優(yōu)化不足而打折扣。
對于開發(fā)者和企業(yè)來說,選擇RTX PRO意味著極低的學(xué)習(xí)成本和遷移成本,以及廣泛的軟件兼容性和很高的性能確定性。選擇競爭對手則可能意味著需要投入大量精力去解決軟件兼容性問題、性能優(yōu)化問題,甚至重寫部分代碼,這在商業(yè)應(yīng)用中是難以接受的。
他還表示,從競品的性能看,偏圖形學(xué)的顯卡 (如 AMD Radeon PRO): 在傳統(tǒng)的CAD設(shè)計、視頻剪輯、三維建模等領(lǐng)域表現(xiàn)出色。但當(dāng)用戶需要進行AI模型訓(xùn)練、AI功能開發(fā)(如AI輔助渲染:深度學(xué)習(xí)超采樣、AI降噪,生成式內(nèi)容創(chuàng)作:在圖形軟件中直接調(diào)用AI模型,生成紋理、3D模型、環(huán)境背景等)時,其AI生態(tài)和硬件性能(缺少成熟的張量核心)就顯得力不從心,導(dǎo)致效率較低或功能無法實現(xiàn)。
偏AI的計算卡 (如一些純AI加速卡,或NVIDIA自家的A100/H100等): 擁有頂級的AI訓(xùn)練和推理性能,但在圖形輸出和實時渲染方面能力為零或極弱。它們無法直接用于高保真的可視化交互。
對于既有圖形渲染能力,又有AI訓(xùn)練和推理性能的RTX PRO來說,能為數(shù)字孿生AI提供一個“單卡解決方案”。用戶可以在同一臺工作站、同一個軟件環(huán)境中,無縫地完成從數(shù)據(jù)可視化、AI模型訓(xùn)練/微調(diào),到最終交互式渲染的全流程。這帶來的總體擁有成本和工作流效率的優(yōu)勢是巨大的。
在數(shù)字孿生領(lǐng)域,國產(chǎn)AI芯片的存在感不足,重視程度需進一步提高。只有全功能的GPU才能滿足數(shù)字孿生領(lǐng)域的需求,也淘汰了不少國產(chǎn)芯片玩家。
但國產(chǎn)芯片也在逐漸發(fā)力,例如摩爾線程,其全功能GPU芯片采用自主研發(fā)的MUSA架構(gòu),實現(xiàn)了單芯片架構(gòu)同時支持 AI 計算加速、圖形渲染、物理仿真和科學(xué)計算、超高清視頻編解碼的技術(shù)突破。其s專業(yè)圖形加速產(chǎn)品,主要應(yīng)用于工業(yè)設(shè)計、高清視頻編輯、數(shù)字孿生、AI云電腦等場景。
一位制造行業(yè)高管表示,相較于大模型訓(xùn)推領(lǐng)域,國產(chǎn)芯片都看到并且投入了大量資源,國產(chǎn)芯片在數(shù)字孿生領(lǐng)域的存在感較低,RTX PRO轉(zhuǎn)向工業(yè)可視化與輕量AI推理,避開國產(chǎn)芯片優(yōu)勢領(lǐng)域,選擇數(shù)字孿生這一有待開發(fā)的藍(lán)海市場,也是英偉達有意為之的戰(zhàn)略選擇。
就目前來看,英偉達的產(chǎn)品短期內(nèi)具有不可替代性,它能夠最大程度的發(fā)揮軟件產(chǎn)品在圖形渲染上的性能和質(zhì)量,以及支撐多并發(fā)多模態(tài)的數(shù)據(jù)融合驅(qū)動的任務(wù)。
但他也表示,在產(chǎn)品交付和部署的過程中,相關(guān)政策鼓勵和支持國產(chǎn)化硬件的替代,部分企業(yè)更希望以國產(chǎn)化的顯卡、芯片等產(chǎn)品實現(xiàn)數(shù)字孿生,但就實際測試效果來看,仍然存在一定性能和質(zhì)量上的差異。此次RTX Pro的“特供版”有望能很好地平衡這個需求。