【熱點(diǎn)資訊】以“圖靈”為名,開啟GPU新的篇章!
溫哥華13號當(dāng)?shù)貢r(shí)間下午4點(diǎn)鐘,英偉達(dá)(NVIDIA)CEO黃仁勛在正在舉辦的計(jì)算機(jī)圖形學(xué)年度會議SIGGRAPH上,放出了一個(gè)重磅更新——英偉達(dá)下一代的GPU架構(gòu)“圖靈(Turing)”,以及應(yīng)用Turing架構(gòu)的對應(yīng)Quadro系列專業(yè)顯卡產(chǎn)品。
會上同期發(fā)布了NVIDIA QuadroRTX 8000、QuadroRTX 6000 和Quadro RTX5000,并向與會的專業(yè)人士詳細(xì)介紹了QuadroRTX Server——一個(gè)面向價(jià)值2500億美元的視效行業(yè)的參考架構(gòu)。
“這從根本上改變了計(jì)算機(jī)圖形的實(shí)現(xiàn)方式,這是現(xiàn)實(shí)主義的一次跨越式變革,”黃仁勛對對臺下1,200多位圖形領(lǐng)域的專業(yè)人士說道。
黃仁勛提到,DellEMC、HPI、Hewlett-PackardEnterprise、聯(lián)想、富士通、Boxx和超微均為支持最新Quadro處理器系列的系統(tǒng)供應(yīng)商。所有三款全新QuadroGPU均將于第四季度上市。
Turing凝聚著超過一萬個(gè)工程年的努力成果– 它采用了可加速光線追蹤的RTCore,以及可用于AI推理的全新TensorCore。黃仁勛解釋說,它們讓實(shí)時(shí)光線追蹤首次成為現(xiàn)實(shí)。
“它已在當(dāng)今應(yīng)用中表現(xiàn)出色,但未來將更加令人贊嘆”,黃仁勛說道。
來自二十多家主要ISV的軟件已對其提供支持。為幫助開發(fā)者快速充分利用Turing的功能,NVIDIA通過全新AI、光線追蹤和模擬SDK進(jìn)一步強(qiáng)化了其RTX開發(fā)平臺,以加快Turing在關(guān)鍵圖形應(yīng)用中的能力,滿足成百上千萬設(shè)計(jì)師、藝術(shù)家和科學(xué)家的需求。
黃仁勛還宣布,NVIDIA從即日起對其材質(zhì)定義語言軟件開發(fā)套件進(jìn)行開源。
“我們?nèi)缃駬碛腥碌能浖褩#m用于集光柵掃描和光線追蹤、計(jì)算和AI于一體的計(jì)算機(jī)圖形學(xué),”黃仁勛說到。
在發(fā)布會現(xiàn)場,老黃為了說明“圖靈”的強(qiáng)大,專門拿它和“帕斯卡(Pascal)”架構(gòu)(均為最強(qiáng)旗艦芯片)進(jìn)行了一個(gè)對比。
晶體管數(shù)量:帕斯卡有(GP102核心)118億個(gè)晶體管,而圖靈則有186億個(gè)晶體管,相比之下增長了57.6%;
芯片面積:帕斯卡芯片大小為471平方毫米,圖靈為754平方毫米;
存儲性能:帕斯卡的容量為24GB、等效帶寬為10GHz,圖靈的顯存容量上升到48+48GB(需要通過NVlink將雙卡互聯(lián)),等效帶寬上升到48GHz。
就這幾個(gè)數(shù)字來看,提升幅度其實(shí)還蠻大。尤其是在晶體管數(shù)量上。從現(xiàn)場了解的情況來看,“圖靈”將會采用12nm工藝,相比“帕斯卡”的14/16nm工藝已經(jīng)有所提升,但芯片實(shí)際尺寸的“暴漲”依舊非常明顯。這種程度的改變,實(shí)際上對芯片制造的良品率和之后的散熱,都提出了比較大的挑戰(zhàn)。
整體對比下來,似乎都是華麗麗的提升。但我們不能忘了另外一個(gè)前輩架構(gòu)“伏特(Volta)”的存在。我們再拿“伏特”的數(shù)據(jù)和“圖靈”簡單去做個(gè)對比。
晶體管數(shù)量:“伏特”(GV100)擁有211億個(gè)晶體管,“圖靈”為186億個(gè)晶體管;
芯片面積:“伏特”(GV100)為815平方毫米,“圖靈”為754平方毫米;
顯存形式:“伏特”采用的是直連的4顆HBM顯存,主要通過顯存位寬來提升整體的顯存帶寬;而“圖靈”采用的GDDR6顯存,則主要依靠運(yùn)行頻率來提升整體顯存帶寬;
CUDA處理器數(shù)量:“伏特”(GV100)擁有5376個(gè)(實(shí)際中部分被屏蔽),“圖靈”為4608個(gè);
Tensor處理器數(shù)量:“伏特”為672個(gè),“圖靈”為576個(gè);
Tensor運(yùn)算能力:“伏特”為125TFLOPS(深度學(xué)習(xí)運(yùn)算能力),“圖靈”為150TFOLPS。
從這些結(jié)果來看,其實(shí)能夠可以看到一個(gè)非常明顯的趨勢,“圖靈”其實(shí)和2017年末登場的“伏特”在一系列參數(shù)上有很高的相似度,但兩者在實(shí)際形態(tài)上又相差甚遠(yuǎn)。
至少從現(xiàn)在來看,“圖靈”所采取的一系列變化,關(guān)鍵詞都是“實(shí)用性”,換個(gè)角度來說就是盡可能將最高端的“伏特”架構(gòu)的部分能力和經(jīng)驗(yàn)重新組合,打造出更低成本的解決方案,并由此打造出最新一代的GPU基礎(chǔ)架構(gòu)。
黃仁勛通過視頻展示,帶領(lǐng)與會者回顧了業(yè)界先驅(qū)過去幾十年在計(jì)算機(jī)圖形領(lǐng)域的歷程,其中許多人就坐在觀眾席中。這樣的偉大追求推動(dòng)著世界的發(fā)展,而這一領(lǐng)域幾十年來一直吸引著全球最智慧的頭腦。
Turing的專用光線追蹤處理器(RTCores)可加速計(jì)算光線和聲音在3D環(huán)境中的傳播方式。與早前的Pascal架構(gòu)相比,Turing將實(shí)時(shí)光線追蹤速度提高了25倍。它可用于電影效果的最終幀渲染,速度可達(dá)CPU速度的30倍以上。
為直觀展示全新Turing架構(gòu)GPU的獨(dú)特性能,黃仁勛在全新的硬件設(shè)備上演示了一個(gè)熟悉的視頻畫面-EpicGames令人驚嘆的星球大戰(zhàn)主題的Reflections光線追蹤畫面。在3月份的游戲開發(fā)者大會,Reflections 運(yùn)行于配備4個(gè)VoltaGPU、價(jià)值70,000美元的DGXStation上,而此次演示則是運(yùn)行于一個(gè)TuringGPU上。
“事實(shí)上它的運(yùn)行就基于這一個(gè)GPU,”黃仁勛說道。伴隨著觀眾的掌聲,他將閃閃發(fā)光的QuadroRTX 8000機(jī)身對準(zhǔn)了攝像機(jī),眨了眨眼睛,激動(dòng)地說道:“這是全球首個(gè)光線追蹤GPU。”
與此同時(shí),Turing架構(gòu)的TensorCore(加速深度學(xué)習(xí)訓(xùn)練和推理的處理器)每秒可提供高達(dá)500萬億次Tensor運(yùn)算。反之,這也為NVIDIANGX軟件開發(fā)套件中包含的AI增強(qiáng)功能(如去噪、分辨率縮放和視頻調(diào)速)提供了支持。
“有時(shí)你可以使用人工智能或啟發(fā)式研究去尋找遺漏點(diǎn)何在,以及我們應(yīng)如何填充,而這使我們能夠相對更快地完成框架,”黃仁勛如是描述了新的深度學(xué)習(xí)技術(shù)堆棧,使開發(fā)者能夠采用預(yù)先訓(xùn)練的網(wǎng)絡(luò),在應(yīng)用中集成加速且增強(qiáng)的圖形、照片成像和視頻處理。
“要實(shí)現(xiàn)這些,沒有什么比深度學(xué)習(xí)更加強(qiáng)大的了,”黃仁勛說道。
光柵化是互動(dòng)式圖形的基礎(chǔ),而Turing進(jìn)行光柵化的速度也比Pascal架構(gòu)快了6倍,黃仁勛說道,并詳細(xì)介紹了可變速率著色、紋理空間著色和多視角渲染等技術(shù)如何為大規(guī)模的模型和場景提供更流暢的交互,并提升VR體驗(yàn)。
談到一款可以測試Turing的圖形教學(xué)工具,黃仁勛通過CornellBox講述了視效的發(fā)展故事。CornellBox是一個(gè)三維盒子,里面展示著各種物體。黃仁勛展示了Turing如何使用光線追蹤來打造復(fù)雜效果-從漫反射到折射、到焦散、再到全局照明,可提供令人贊嘆的照片級寫實(shí)感。
黃仁勛的另一個(gè)驚艷四座的展示是一輛保時(shí)捷70周年紀(jì)念款原型車的視頻。這一照片級寫實(shí)的模型看起來像是拍攝好的,但它其實(shí)完全是TuringGPU在EpicGames的UnrealEngine引擎生成的?!暗谝淮?,NVIDIARTX使我們能夠?qū)⒓铀俚墓ぷ髁鞒掏葡蚴袌觯⒓铀偈袌霭l(fā)展,”黃仁勛說道。
希望攻克此類項(xiàng)目的創(chuàng)作者將擁有大量可供選擇的工具。除了三款功能強(qiáng)大的Turing顯卡(售價(jià)3,300美元的QuadroRTX 5000、售價(jià)6,300美元的QuadroRTX 6000和售價(jià)10,000美元的QuadroRTX 8000),黃仁勛還發(fā)布了RTXServer。
它配備了8個(gè)TuringGPU,旨在將渲染時(shí)間從數(shù)小時(shí)縮短到數(shù)分鐘。四臺搭載8個(gè)GPU的RTXServer能夠以1/4的成本完成240個(gè)雙核服務(wù)器的渲染工作,占地空間卻僅為其1/10,功耗僅為其1/11?!皬那靶枰ㄙM(fèi)五六個(gè)小時(shí)完成的拍攝,如今只需要一個(gè)小時(shí),”黃仁勛說道,“這將徹底改變?nèi)藗兣臄z電影的方式?!?/strong>
總而言之,黃仁勛稱Turing為“全球首個(gè)光線追蹤GPU”,并且是“有史以來我們實(shí)現(xiàn)最大飛躍的一代產(chǎn)品”。
黃仁勛的演講在一個(gè)被稱為Sol的演示視頻中收官,畫面中一對機(jī)器人助手,利落地為畫面中的主角穿上了白色盔甲。
盔甲表面的光線追蹤反射營造出一種未來感,當(dāng)主角走到艙口準(zhǔn)備出去時(shí),無人監(jiān)督式機(jī)器人突然跟著歌曲跳起舞來。
聽到音樂,身披盔甲的主角又回到了原位,先是驚訝地抬起頭,然后突然也跟著音樂舞動(dòng)起來,并相當(dāng)帶勁兒。
音樂未止,人們追求技術(shù)革新的步伐也不會停止。