近日,一種基於GPU並行的快速近場(chǎng)動(dòng)力學(xué)算法,實(shí)現(xiàn)了計(jì)算力學(xué)算法與計(jì)算機(jī)技術(shù)的深入交叉結(jié)合,為解決傳統(tǒng)計(jì)算力學(xué)算法的效率問題找到了新的方向。
與現(xiàn)有基於串行程序和共享內(nèi)存並行編程 (OpenMP)並行的近場(chǎng)動(dòng)力學(xué)算法程序相比,該算法分別可實(shí)現(xiàn)高達(dá)800倍和100倍的加速。在典型的百萬級(jí)粒子模擬中,執(zhí)行4000次迭代在單精度下可在5分鐘內(nèi)完成,在雙精度下可在20分鐘內(nèi)完成,這在低端GPU PC上即可實(shí)現(xiàn)。
這項(xiàng)技術(shù)的廣泛應(yīng)用將有助於推動(dòng)多個(gè)領(lǐng)域的創(chuàng)新,特別是在需要高性能計(jì)算支持的行業(yè)中。通過利用消費(fèi)級(jí)GPU的強(qiáng)大計(jì)算能力,研究人員能夠更高效地解決複雜的物理問題,從而推動(dòng)科技進(jìn)步和產(chǎn)業(yè)升級(jí)。
該成果發(fā)表在《計(jì)算力學(xué)學(xué)報(bào)》和《Engineering Analysis with Boundary Elements》。作者為深圳北理莫斯科大學(xué)楊楊副教授,與南方科技大學(xué)劉軼軍講席教授、碩士研究生蘇梓鑫。深圳北理莫斯科大學(xué)為第一完成單位。
在低端GPU PC上即可實(shí)現(xiàn)
近場(chǎng)動(dòng)力學(xué)(Peridynamics)是一種有效解決斷裂問題的方法。由於近場(chǎng)動(dòng)力學(xué)的非局部特性,每個(gè)材料點(diǎn)僅與其鄰域內(nèi)的點(diǎn)相互作用,這使得其非常適合進(jìn)行並行化處理。目前,基於GPU的近場(chǎng)動(dòng)力學(xué)並行研究,大多集中在將串行程序轉(zhuǎn)換為並行程序。許多優(yōu)化策略帶來的加速效果主要依賴於GPU自身性能的提升,而針對(duì)GPU硬件結(jié)構(gòu)的優(yōu)化相對(duì)較少。此外,GPU並行計(jì)算仍存在一些問題:用於存儲(chǔ)鄰域點(diǎn)的內(nèi)存空間沒有預(yù)設(shè)大小,導(dǎo)致線程和內(nèi)存資源的低效使用,造成內(nèi)存和計(jì)算資源的浪費(fèi),使得GPU在處理大規(guī)模問題時(shí)面臨挑戰(zhàn);大多數(shù)GPU並行計(jì)算仍然嚴(yán)重依賴全局內(nèi)存,未能充分利用英偉達(dá)的統(tǒng)一計(jì)算設(shè)備架構(gòu)(NVIDIA's Compute Unified Device Architecture, CUDA) 的內(nèi)存結(jié)構(gòu),導(dǎo)致內(nèi)存帶寬的浪費(fèi);大多數(shù)近場(chǎng)動(dòng)力學(xué)並行算法缺乏通用性,一些算法可能限制了鄰域的大小,僅能處理均勻分布且未受損的離散結(jié)構(gòu),或者限制了近場(chǎng)動(dòng)力學(xué)理論的應(yīng)用。
基於上述限制,本研究設(shè)計(jì)了一個(gè)成本效益高且性能優(yōu)異的近場(chǎng)動(dòng)力學(xué)模擬框架。該分析框架能夠以高效的計(jì)算速率準(zhǔn)確模擬鍵基和態(tài)基近場(chǎng)動(dòng)力學(xué)問題。該算法採用了粒子並行模式,建立了一個(gè)通用的鄰域生成模塊用以優(yōu)化存儲(chǔ),並提出了一種通用寄存器技術(shù),用於高速訪問寄存器內(nèi)存,減少全局內(nèi)存訪問。該技術(shù)不僅消除了對(duì)鄰域點(diǎn)數(shù)量的限制,還適用於材料點(diǎn)的非均勻分布。
與現(xiàn)有基於串行程序和OpenMP並行的近場(chǎng)動(dòng)力學(xué)算法程序相比,該算法分別可實(shí)現(xiàn)高達(dá)800倍和100倍的加速。在典型的百萬級(jí)粒子模擬中,執(zhí)行4000次迭代在單精度下可在5分鐘內(nèi)完成,在雙精度下可在20分鐘內(nèi)完成,這在低端GPU PC上即可實(shí)現(xiàn)。這意味著,在處理複雜的材料設(shè)計(jì)和損傷模擬時(shí),研究人員能夠更快地獲得結(jié)果,從而加速科學(xué)研究和工程應(yīng)用的發(fā)展。
楊楊博士於2023年9月加入深圳北理莫斯科大學(xué)材料科學(xué)系,主要研究方向?yàn)椋河?jì)算固體力學(xué)、邊界元、近場(chǎng)動(dòng)力學(xué)、機(jī)器學(xué)習(xí)等高性能算法開發(fā),結(jié)構(gòu)振動(dòng)、斷裂、疲勞分析。(記者 林麗青)
頂圖:通用寄存器優(yōu)化算法示意圖