0
| 本文作者: 包永剛 | 2018-08-14 12:08 |
雷鋒網消息,英偉達CEO黃仁勛(Jensen Huang)在今日的SIGGRAPH 2018上正式發布了此前已被曝光的新一代GPU架構——Turing(圖靈)。同時,一系列基于圖靈架構的GPU包括Quadro RTX 8000、Quadro RTX 6000、Quadro RTX 5000以及Quadro RTX Server、CUDA10也共同亮相。
黃仁勛表示:“圖靈架構是自2006年CUDA GPU發明以來最大的飛躍,Quadro RTX系列也是全球首批支持即時光線追蹤(Real Time Ray Tracing)的GPU。”

圖靈(Turing)架構
黃仁勛將圖靈架構描述為英偉達十多年來在計算機圖形領域最重要的創新。這是一個很明確的標準,圖靈架構是英偉達的第八代GPU架構,使全球首款光線追蹤GPU成為可能,也是超過一萬個工程師的努力成果。圖靈架構承載了RT核心(RT Core)以及全新張量核心(Tensor Core)。

RT核心專門用于實時光線追蹤的處理器,能對光線和聲音在3D環境中的傳播進行加速計算,據稱它的實時光線追蹤能力提升到了Pascal架構的25倍。張量核心是為深度學習訓練和推斷加速的處理器,支持每秒500萬億次張量運算。這些新功能包括DLAA(深度學習抗鋸齒),以及去噪、分辨率縮放和視頻調速。這些特性是NVIDIA NGX 軟件開發套件的一部分,這種全新深度學習技術堆棧可助力開發者通過預先訓練的網絡,輕松地在應用中集成加速且增強的圖形、照片成像和視頻處理。
英偉達承若圖靈架構GPU模擬物理世界的能力將比Pascal架構提升6倍。
需要補充的是,RTX光線追蹤技術(Ray-Tracing)是英偉達在3月發布新技術,這項新技術能夠計算光線反射、折射、散射等路線,渲染出逼真的畫面,可為游戲開發者提供電影級畫質的實時渲染。更具體的來說,就是在真實世界中,我們看到的3D物體被光源照亮,且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術則反過來,通過從觀者眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,通過追蹤2D視表面上每個像素的光線的路徑,并應用到場景的3D模型中。
實時光線追蹤技術過去只在影視作品的CG制作中出現,一般是用幾天時間,渲染出幾幀動畫,這個動畫的陰影、金屬和水面的折射以及反射等都很逼真。

全球首批即時光線追蹤GPU——Quadro RTX
黃仁勛在SIGGRAPH 2018上同時帶來了全球首批支持即時光線追蹤的GPU——Quadro RTX系列。Quadro是英偉達的專業級顯卡,主要面向設計、特效、科學可視化等視覺計算任務。
基于圖靈架構的GPU采用了流式多處理器(SM)架構,該架構新增了與浮點數據路徑并行執行的整數執行單元,以及帶寬為早前架構兩倍的全新統一緩存架構。結合可變速率著色等全新圖形技術,圖靈流式多處理器架構實現了前所未有的單核性能水平。
新發布的Quadro RTX包括三款產品,分別是Quadro RTX 8000、Quadro RTX 6000、Quadro RTX 5000,具有16T單精度浮點性能,每秒10G GigaRays/sec(GigaRays/sec,用來描述光線追蹤性能),每秒500T OPs深度學習,支持NVLink,每秒100GB,支持每秒500萬億張量的操作。
核心面積增至754平方毫米,最大顯存48GB GDDR6,集成186億晶體管,顯存頻率14GHz,可實現硬件加速的AI、光線追蹤和仿真。

現場,黃仁勛還展示了幾幀用Quadro RTX渲染《復仇者聯盟3》里蜘蛛俠跳起吐絲的畫面。
Quadro RTX系列新品的特性包括:
RT Core可實現對象和環境的實時光線追蹤,并做到物理上精確的陰影、反射和折射以及全局光照;
Tensor Core可加速深度神經網絡訓練和推理;
圖靈流式多處理器(Turing Streaming Multiprocessor)架構擁有4608個CUDA core,可提供高達16 teraflops的計算性能,并行運算每秒16萬億次整數運算,以加速模擬真實世界的物理模擬;
先進的可編程著色技術可提高復雜視效和圖形密集型工作體驗;
首次采用超快速的三星16Gb GDDR6內存,支持更復雜的設計、海量建筑數據集、8K電影內容等;
NVIDIA NVLink可通過高速鏈路聯通兩個GPU,將內存容量擴展至96 GB,并可通過高達100GB / s的數據傳輸提供更高性能;
提供對USB Type-C和VirtualLink的硬件支持;
增強型技術可提高VR應用性能,包括可變速率著色(Variable Rate Shading)、多視角渲染(Multi-View Rendering)和VRWorks Audio。
據雷鋒網了解,三款新GPU預計今年第四季度發售,開發人員可以通過新的NVIDIA RTX(TM)訪問Quadro RTX,并提供一系列創意應用程序和工具,包括用于光線跟蹤,AI,光柵化和模擬的API。價格方面,Quadro RTX 8000配備48GB內存,售價10000美元;Quadro RTX 6000配24GB內存,售價6300美元;Quadro RTX 5000配16GB內,2300美元ESP。

Quadro RTX服務器
在展示基于RTX的Porsche demo后,黃仁勛還發布了Quadro RTX服務器,它將Quadro RTX GPU與明年第一季度將推出新的Quadro Infinity軟件相結合,提供強大而靈活的架構,滿足創意專業人士的需求。Quadro Infinity將允許多個用戶通過虛擬工作站訪問單個GPU,從而顯著提高數據中心的密度。
據悉,Quadro RTX服務器預裝了領先的內容創建和渲染軟件,提供功能強大且易于部署的渲染解決方案,可從小型安裝擴展到最大的數據中心,僅占CPU成本的四分之一渲染農場。

CUDA10
CUDA是構建英偉達GPU加速的軟件,與之前的版本相比相比,CUDA10具有的新特性包括:
支持圖靈架構;
新增性能優化庫,在16-GPU系統中實現強大的FFT性能擴展;
nvJPEG:用于混合JPEG處理的新庫,單個和批量圖像解碼速度是原來2倍;
CUDA / Graphics Interop:CUDA和圖形API之間的新互操作性;
新的開發人員工具:用于跟蹤,分析和調試CUDA應用程序的新Nsight產品系列工具。
在軟件層面,英偉達還宣布開放MDL。
當然,黃仁勛最后還表示從Adobe(針對Dimension CC)到皮克斯、Siemens、Black Magic、Weta Digital、Epic Games和Autodesk等公司已經簽約支持新的圖靈架構。雷鋒網認為這將讓產品設計師、游戲設計師、建筑師們的光線計算開始變得簡單。
相關文章:
英偉達推出首款AI和HPC的統一平臺HGX-2,售價39.9萬美元
5 年提速 500 倍,英偉達 GPU 創紀錄突破與技術有哪些?
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。