|
近日(4月12日),雷鋒網(wǎng)受邀參加了英偉達(dá)在北京國(guó)家會(huì)議中心舉行媒體發(fā)布會(huì)。會(huì)上英偉達(dá)展示了其發(fā)布不久的基于Pascal架構(gòu)的Quadro系列顯卡,包括:GP100、P2000、P4000、P5000、P6000等。 不同于Geforce的消費(fèi)級(jí)娛樂(lè)定位,Quadro立足高端,面向?qū)I(yè)級(jí)的需求,英偉達(dá)的愿景是讓它們能夠?qū)⑴_(tái)式工作站轉(zhuǎn)變?yōu)榫哂型黄菩阅芰Φ某?jí)計(jì)算機(jī),并為不同行業(yè)的專業(yè)任務(wù)提供保障。
Pascal架構(gòu)的全新NVIDIAQuadro產(chǎn)品陣容致力于為企業(yè)提供視覺(jué)計(jì)算平臺(tái),簡(jiǎn)化設(shè)計(jì)和仿真工作流程。與上一代產(chǎn)品相比,新Quadro產(chǎn)品不僅具有超快速內(nèi)存,而且速度最多可以提升兩倍(基于SPECviewperf12基準(zhǔn)的計(jì)算結(jié)果)。 其中GP100為該系列的旗艦產(chǎn)品,被科技媒體和粉絲們稱為超當(dāng)量核彈。 QuadroGP100參數(shù)及系列特點(diǎn) GP100 GP100基于Pascal核心,匹配16GBHBM2顯存,單精度CUDA核心數(shù) 3584個(gè),雙精度CUDA核心數(shù)1792個(gè),半精/單精/雙精浮點(diǎn)運(yùn)算性能分別是20TFLOPS、10TFLOPS和5TFLOPS,帶寬高達(dá)720GB/s,功耗235W。同其他新發(fā)布的專業(yè)卡一樣,它的性能提升也是全方面的(比如同步多重投影、VRWorks、IrayVR),同時(shí)還強(qiáng)化了虛擬化、SyncII、雙路NVlink等。 這也是NVlink首次在Windows系統(tǒng)上獲得支持,此前僅僅用于IBMPower8系統(tǒng)和基于Linux的DGX-1,帶寬最高80GB/s。 這個(gè)系列官方給出的特點(diǎn)如下: 統(tǒng)一仿真、HPC、渲染和設(shè)計(jì):GP100將前所未有的雙精度性能與16GB的高帶寬內(nèi)存(HBM2)相結(jié)合,因此用戶可以在設(shè)計(jì)過(guò)程中進(jìn)行仿真,并以前所未有的速度采集逼真的多物理場(chǎng)仿真。客戶能夠?qū)蓚(gè)GP100GPU與NVLink技術(shù)相結(jié)合,并擴(kuò)展到32GB的HBM2,以在單一工作站上創(chuàng)建龐大的可視化計(jì)算解決方案。
探索深度學(xué)習(xí):GP100提供超過(guò)20TFLOPS的半精度計(jì)算,可謂在Windows和Linux環(huán)境中進(jìn)行深度學(xué)習(xí)的理想開發(fā)平臺(tái)。 將VR集成到設(shè)計(jì)和仿真工作流程中:VR認(rèn)證的QuadroGP100和P4000具有創(chuàng)建詳細(xì)、逼真、沉浸式環(huán)境的能力,能夠大規(guī)模實(shí)現(xiàn)更加宏大、更加復(fù)雜的設(shè)計(jì)體驗(yàn)。 盡享照片級(jí)真實(shí)感設(shè)計(jì)的優(yōu)勢(shì):基于Pascal架構(gòu)的QuadroGPU渲染照片級(jí)真實(shí)感圖像的速度為CPU的18倍。 創(chuàng)建廣闊的可視化工作區(qū):可在多達(dá)四個(gè)5K顯示器上以高分辨率和HDR顏色顯示數(shù)據(jù)。 經(jīng)濟(jì)高效地構(gòu)建超高分辨率及多顯示屏配置:通過(guò)將多達(dá)8個(gè)P4000GPU和兩個(gè)QuadroSyncII顯卡相結(jié)合,可通過(guò)單一機(jī)箱實(shí)現(xiàn)多達(dá)32個(gè)4K顯示器的配置。 GPU在CAE上的應(yīng)用
CA(ComputerAidedEngineering)指工程設(shè)計(jì)中的計(jì)算機(jī)輔助工程。英偉達(dá)專業(yè)可視化業(yè)務(wù)高級(jí)總監(jiān) SandeepGupte 表示: 對(duì)于這部分用戶,大部分是使用類似Ansys、ABAQUS等分析軟件求解復(fù)雜工程和產(chǎn)品的結(jié)構(gòu)力學(xué)性能。大規(guī)模的數(shù)據(jù)計(jì)算往往讓設(shè)計(jì)分析的過(guò)程十分漫長(zhǎng),而如果使用CPU+GPU加速的方案將會(huì)大大的節(jié)省運(yùn)算時(shí)間。 GPU加速計(jì)算是指在完成應(yīng)用任務(wù)時(shí),同時(shí)利用GPU和CPU。由于GPU出色的并行任務(wù)處理能力,將應(yīng)用程序中計(jì)算密集部分的工作負(fù)載轉(zhuǎn)移到GPU,同時(shí)仍由CPU運(yùn)行其余程序代碼。這樣,從用戶的角度來(lái)看,應(yīng)用程序 流言終結(jié)者中有一段很有意思的視頻,為我們直觀的展示了相比于CPU,GPU的的運(yùn)行速度明顯加快。并行計(jì)算為什么有如此令人震撼的優(yōu)勢(shì)。 視頻:點(diǎn)此觀看 Sandeep舉了個(gè)實(shí)際的例子,在現(xiàn)場(chǎng)一個(gè)集成了一張GP100的工作站里,工作人員使用ABAQUS對(duì)一個(gè)模型進(jìn)行了470萬(wàn)的網(wǎng)格劃分和計(jì)算,由于時(shí)間關(guān)系,現(xiàn)場(chǎng)并未將計(jì)算完成。正是因?yàn)轭愃七@樣大規(guī)模的計(jì)算,往往需要運(yùn)行數(shù)十個(gè)小時(shí)甚至是數(shù)十天才能完成。 不過(guò)Sandeep告訴雷鋒網(wǎng),相比僅使用CPU計(jì)算的方案,GPU加速可以將計(jì)算時(shí)間將縮短為原來(lái)的1/3。 |
免責(zé)聲明:本網(wǎng)站內(nèi)容由網(wǎng)友自行在頁(yè)面發(fā)布,上傳者應(yīng)自行負(fù)責(zé)所上傳內(nèi)容涉及的法律責(zé)任,本網(wǎng)站對(duì)內(nèi)容真實(shí)性、版權(quán)等概不負(fù)責(zé),亦不承擔(dān)任何法律責(zé)任。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。