日本中文一区二区三区_99re国产视频_国产经典视频一区_网站在线观看你懂的

國家超級計算天津中心黨組成員、總工程師馮景華:基于自主算力的產業(yè)賦能經驗分享

泰達汽車論壇2024-08-31
38760

由中國汽車技術研究中心有限公司、中國汽車工程學會、中國汽車工業(yè)協(xié)會、中國汽車報社共同主辦,天津經濟技術開發(fā)區(qū)管理委員會特別支持,日本汽車工業(yè)協(xié)會、德國汽車工業(yè)協(xié)會、中國汽車動力電池產業(yè)創(chuàng)新聯(lián)盟、新能源汽車國家大數(shù)據(jù)聯(lián)盟聯(lián)合協(xié)辦的第二十屆中國汽車產業(yè)發(fā)展(泰達)國際論壇(以下簡稱“泰達汽車論壇”)于2024年8月29日至9月1日在天津濱海新區(qū)舉辦。本屆論壇以“風雨同舟二十載 攜手并肩向未來”為年度主題,邀請重磅嘉賓展開深入研討。

在8月30日“生態(tài)專場二:加速云計算與數(shù)字技術應用,推動新質型產業(yè)發(fā)展”中,國家超級計算天津中心黨組成員、總工程師,天津市天河計算機技術有限公司執(zhí)行董事、總經理馮景華發(fā)表了題為“基于自主算力的產業(yè)賦能經驗分享”的演講。

1馮景華.jpg

國家超級計算天津中心黨組成員、總工程師,天津市天河計算機技術有限公司執(zhí)行董事、總經理  馮景華

以下為演講實錄:

對于算力國家是有明確定義的。對于算力的引導性,比如要建什么樣的算力,如何做通用計算、超計算和智能計算的合理梯次布局,最新發(fā)布的文件中“一體化算力網”建設涵蓋了通用計算、智能計算、超級計算的融合算力中心。

從個人視角看,或者是從學術的視角看,其實并不太過分區(qū)分超算和智算的區(qū)別。超算和智算的區(qū)別在哪兒,從個人視角看,核心區(qū)別在于算力精度,因為超算通常是用LP64雙精度的計算能力來表達科學計算的精度問題,智算通常是LP16的能力。但是,其實客觀講,建一個超算中心,或者建一個智算中心,天津超算不太區(qū)分這個,因為超算和智算都是同樣的算力,而且現(xiàn)在融合算力發(fā)展趨勢也非常明顯,很多應用比如說傳統(tǒng)氣象的科技計算應用是非常傳統(tǒng)的,做氣候氣象、氣候預報的,做臨時、短時、中長期的預報,現(xiàn)在很多也要介入人工智能,APC+AI,而且現(xiàn)在有很多科學研究是用AI for Science,用AI來解決Science求解工作量大的問題,所以是不太區(qū)分的。比如說美國的算力中心大部分都叫超級計算機。因為美國以英偉達為代表的單位,生產的GPU是帶著LP64和LP16的能力,所以GPU既可以用科技計算,也可以用于智能計算。但是我們國內的某些芯片設計中只有LP16,沒有雙精度。大家可以看到,像英偉達的比如說H100系列,就是雙精度計算能力和網絡帶寬。但是從芯片的底層結構講,其實個人不太區(qū)分超算和智算,因為上層應用需求是多樣性的,不同的應用領域、行業(yè)需求需要超算和智算,國家層面也是建立涵蓋超算、智算的通用融合算力中心,并沒有強調一定要建智算或者是超算。

國家關于算力作用非常明確,主要有四個方向作用,即助推產業(yè)升級、賦能科技創(chuàng)新、滿足人民美好生活和實現(xiàn)高效社會治理。在跟很多單位合作的時候,這是基本的認知,算力是一定會產生價值的。對算力的投入,投入多少錢會有多少數(shù)字經濟的產出,雖然這個比例值不太一樣,但是大多數(shù)都是明確的,算力投入一定會帶動數(shù)字經濟,因為算力本身就是一個數(shù)字產業(yè)化的過程,會推動產業(yè)數(shù)字化的發(fā)展。從算力中心的角度,確實要兼顧這四個方面的作用,至少要兼顧其中一兩個方面,不是單純的建一個算力中心出去給用戶。

從2010年一直到現(xiàn)在,天河一號到現(xiàn)在也是世界領先的結構,基本上采用世界領先的“異構體系結構”融合的算力模式,由基礎設施、計算處理、互聯(lián)通信、并行存儲等硬件組成,軟件包括服務環(huán)境、運行庫、應用環(huán)境和管理服務平臺等。而且,全部使用的國產芯片。也實現(xiàn)了云、超算、智算的融合,當然它有自己配套的運營管理、算力服務、資源調度、人工智能開發(fā)平臺、綜合一體化平臺等等這些。以芯片為例,可以看到MT-3000芯片的性能指標,由通用儲蓄盒和加速處理單元組成的。國產的GPU芯片不是類似的結構,但也包括通用處理單元和協(xié)助單元還有GSM全局共享存儲單元等。從體系結構就能夠看出來它很復雜,所以調動應用的時候絕不像CPU這樣簡單,CPU是同構的,所有芯片都是一樣的,訪存也是一樣的,訪存要走來走去,要從加速處理單元到通用處理單元,內存之間包括編制空間也不一樣,這些都很復雜,所以寫代碼的時候需要對核心代碼重寫,所以面臨很大挑戰(zhàn)性。當然,寬向量體系解決的一個問題,為了發(fā)揮性能指標,要有實現(xiàn)更大的計算能力,同時要實現(xiàn)自動變優(yōu)化,能夠讓程序少寫一點,少改一點,同時能兼顧一些性能的提升。還有一些異構編程接口,像GPU里面有統(tǒng)一的聯(lián)盟OpenCL,就是做GPU之間的接口,所以實現(xiàn)所謂NMB、英偉達等等生態(tài)的兼容,但是這種兼容一定會帶來性能損失,這是正常的魚和熊掌很難兼得。了解底層邏輯,代碼寫起來就很復雜,如果你不想了解底層邏輯,用接口編輯的時候就會帶來性能的損失,因為不同的編制空間、不同的方式,計算方法不一樣。甚至一個簡單的矩陣乘法,行列的排列方式都會帶來效率的不一樣。

基于國產算力的,面向汽車領域很多場景下的應用,三個層次問題是要解決的:

一是底層庫。像常用的人工智能的基本算子、科學計算的ILP庫等等這些基礎庫,是沒有辦法通過優(yōu)化,甚至要用到底層匯編,才能發(fā)揮極致性能。在這種情況下,大家就可以用庫來提升應用,應用甚至都不用重寫,通過庫就可以達到質的提升,即使無法發(fā)揮100%,能發(fā)揮30%、40%,也是質的提升。

二是典型應用的移植和優(yōu)化。面向汽車產業(yè)的很多應用,沒有編制,沒法移植,只能基于自己的工業(yè)軟件做移植。這個移植和優(yōu)化功能也是一個很大的工作量要做的,基本上一個軟件,10萬行左右代碼的軟件基本上需要5至6個人半年的時間,這個工作量是很大的,要調優(yōu),要移植、優(yōu)化。

三是整合平臺。從用戶層面角度其實不太關心底層邏輯,甚至都不關心底層用的什么芯片,重要的是我的應用要能夠跑起來。就像汽車上的應用,應用到底用在什么樣的芯片用戶是不關心的,用戶關心的是這個應用跑的好不好、快不快。要把這個應用移植好以后放在平臺上,通過平臺調度,打好底層的接口,上層不感知,讓用戶用起來更簡單。

如果選擇了國產的算力芯片,基本上這三層都是要面臨的,不管是做工業(yè)軟件還是做智能網聯(lián)車,還是做其他的,都是要解決的問題。

舉幾個例子。比如做智算,從整個框架從頭開始寫,對于模型的、推理的,包括FFT、ftmDNN庫、訓練庫,包括適配相應的算子庫、設備庫、通信庫等等,我們做了一個3D的渲染框架,是開源的,網上能查到,支持GPU版本,支持外創(chuàng)版本,也可以實現(xiàn)大規(guī)模智能化運營開發(fā)訓練,3D的并行訓練,其實工作量還是很大的。實現(xiàn)了可編程性和效率,提高可編程性還兼顧效率,肯定不能說既提高可編程性又達到極致的效率,但是我們在做嘗試,讓它既好用又能夠更快。比如做顯示屏的軟件,這個是完全自主的,每一行代碼都是自己寫的,從后處理的算法到前端的展示到整個應用等,入選了科創(chuàng)中國的先導技術榜,也有很多專利。這個基本上能夠對標國外的,是用來做顯示動力學的爆炸、毀傷、沖撞、碰撞等結構的力學軟件,比如說像航空發(fā)動機攝入無人機以后是什么狀態(tài),太空碎片撞擊衛(wèi)星會怎么樣,比如說一個子彈或者是導彈射到一個墻體上,甚至還有飛機庫等。

汽車里也有類似結構的應用,這是我們做的顯示動力學的基本軟件。這個很難,行業(yè)里面也有很多汽車的單位參與CAE聯(lián)盟,它里面講到專家們有一個共識的觀點,工業(yè)軟件的差距遠遠超過芯片,芯片現(xiàn)在說3至5年,但是工業(yè)軟件差距還是比較大,還有很大的工作量,但是這兩年國家花了很大的力氣,給了很大的支持在做工業(yè)軟件。

基于自主芯片做的智能的大模型,生成式的智能,包括云的開發(fā),在海關、政務、醫(yī)療領域,汽車還沒用,其實可以做很多深入的工作,這里面有很多工作量。好處是完全基于國產芯片去適配。在汽車產業(yè)領域其實主要是目前做的比較成熟的是仿真研發(fā)相關的工作,也有一體化的平臺,從應用的底層、數(shù)據(jù)(包括行業(yè)的材料數(shù)據(jù)、模型數(shù)據(jù)、測試數(shù)據(jù))、商業(yè)軟件,還有自主國產的軟件,整合在一起,其實就是數(shù)據(jù)和軟件的整合,給上層應用做服務,把我們的應用層里面的開發(fā)工具,包括機器學習和測評、優(yōu)化的方式和方法、流程整合在一起,再加上項目管理能力,實現(xiàn)業(yè)務邏輯,從產品需求到方案設計,從性能目標到仿真自動化。這個過程也是讓項目經理、測試工程師、仿真工程師、設計工程師全程參與其中,共同完成一個項目,共同推進一個成果的落地,例如研發(fā)成果、做新產品、新工業(yè)優(yōu)化等。這是我們做的從底層到管理、項目協(xié)同,實現(xiàn)了整個項目的管理,項目里可以列進度和進展計劃、人物權限,來保證項目的安全性等等,包括執(zhí)行的流程性,包括數(shù)據(jù)管理、材料管理、性能管理,知識庫的一些基本管理。

底層的支持依賴于軟硬件的資源,包括資源管理、資源分配、資源調度、求解器等,整合在一起就是汽車產業(yè)領域的服務。比如說我們做電池的、做模具的、做整車的、做系統(tǒng)分析的,包括數(shù)值風洞等等。舉幾個典型的例子,比如做汽車性能大規(guī)模的仿真分析,超低風阻數(shù)字化的開發(fā),還有復雜環(huán)境的性能仿真,還有多工況、多方案的安全性能的開發(fā)和尋優(yōu),還有批量計算作業(yè)的提交,可以針對一個項目,批量提交計算任務,然后得到結果,然后盡快地反饋項目基本完成的情況。

風洞基本上實現(xiàn)了國產化替代,從算力芯片、底層算力資源到軟件數(shù)值風洞CFD軟件,都實現(xiàn)了比傳統(tǒng)商用的并發(fā)處理難以滿足數(shù)值風洞的快速計算需求的情況下,實現(xiàn)了CFD計算結果和數(shù)值風洞測試結果進行對標,是國產軟件、國產芯片或者國產的算力系統(tǒng)支持做的。我們做的仿真一體化平臺,從算力資源到應用,甚至后面的人工智能的工作,都在推進的過程中。

以上是把我們在汽車產業(yè)能做的工作給大家分享,如果有興趣可以再進一步溝通,謝謝!

責任編輯:王思思
后發(fā)表評論
信息咨詢
請輸入11位手機號

×
登錄
注冊
忘記密碼