當然,解惑這類問題并不是筆者的初衷。對高大上技術的熱愛,就貌似看“別人家孩子”的盲從,總覺得別人家孩子怎么那么優秀,那么聽話,那么講禮貌,那么多才多藝……HPC怎么那么高大上,它除了用于海洋、勘探、天氣預報、科研等這些領域,企業級業務該如何使用?
近期,企業網D1Net記者在“2018聯想超算”大會上,采訪到長城汽車IT管理本部系統科負責人林海鑫先生,共同探討了HPC在企業級應用的前景以及應用難點、困惑與經驗。
上圖為:長城汽車IT管理本部林海鑫
數字化轉型是傳統企業下一階段面臨的必經之路
長城汽車股份有限公司是全球知名的SUV制造企業,于2003年、2011年分別在香港H股和國內A股上市,截止2017年底資產總計達1105.47億元。長城汽車總部坐落于河北省保定市,是A股和港股同時上市企業,也是中國最大的SUV生產企業,連續4年保持了SUV銷售第一,19年保持皮卡占有率和銷量第一,目前產品銷往全球128個國家和地區,2017年累計銷售107萬輛。
長城汽車秉承“每天進步一點點”的企業理念,擁有先進的企業文化和管理團隊,創建了獨具特色的經營和管理模式,經營質量在國內汽車行業首屈一指。
目前,旗下擁有哈弗、長城、WEY和歐拉四個品牌,產品涵蓋SUV、轎車、皮卡三大品類,擁有四個整車生產基地,具備發動機、變速器等核心零部件的自主配套能力,下屬控股子公司40余家,員工7萬余人。
長城汽車的經營目標是到2020年積極拓展新能源及后市場業務,成為全球銷量第一的專業SUV品牌,并打造用戶滿意度第一,經銷商、供應商滿意度第一的一家汽車企業。
顯然,長城汽車作為中國的一個自主品牌,能有今天這個成績,應該說相當不易。但企業發展必須要有后勁,林海鑫說:“數字化轉型是傳統企業下一階段面臨的必經之路。構建行業領先的應用系統,打造智慧的長城,增強企業競爭優勢,是擺在我們面前的一個迫不及待的問題。智慧的長城汽車包括智慧的產品、智慧的研發、智慧的制造等等。而在這里,最核心的一個問題是智慧的研發。”
長城汽車:亟須解決研發資源與業務需求的矛盾
據林海鑫介紹:長城汽車這幾年秉持對研發的過渡投入政策,在全球建立了研發中心,包括奧地利、德國、美國的底特律、日本、韓國、印度等地,均打造了研發中心,同時也大批量地招聘了全球科研專家,比如電動以及新能源領域,在短短的幾個月時間里,長城汽車迎來了200多名外籍專家的加入。隨著專家的人數越來越多,對研發提出的要求也越來越多。因此,長城汽車 IT面臨最大的問題是如何應對大家對研發資源的滿足上。
如何滿足這么多的研發需求?林海鑫在探索相關的解決方案后,給出的最終答案是建設HPC。
HPC帶給長城汽車的三重價值
首先,提升了長城汽車的研發能力。比如:汽車在上市之前都要經過安全認證,三星級、四星級、五星級各種認證方式,傳統的認證需要用實車不斷地做碰撞,正碰、側碰、各種角度碰撞,以證明其安全性,因而導致停車場里總有大批量撞壞的車一直在那放著,只能等待報廢。其原因是以前的研發能力無法保證其精度,通過部署HPC后,HPC對研發能力的提升起到了非常顯著的作用,既提高了計算的精度,也縮短了計算的時間,可直接支持研發戰略落地,通過充分識別研發風險及問題,把問題前置。現在,長城汽車已經很少有撞壞的車,只需要在上市之前做實物的碰撞,直接做認證就可以了。
再比如對NVH也就是汽車噪聲的控制研發,以前消費者對自主品牌汽車的感覺是開一段時間后噪聲便會變得特別嚴重,一開空調嗡嗡嗡作響,造成這種現象的原因是風阻大于60以后,風噪會對汽車產生比較大的影響。以前需要等風來之后研究風噪的影響,而HPC則可以完全模擬上述運算,這個技術在WEY品牌上得到了充分使用,很多人對WEY的評價是“仿佛進入了一個獨立的空間非常安靜”,此外,針對風阻這塊HPC也做出了計算,實踐證明對油耗有很明顯的改觀。
其次,降低了總體應用成本。通過采用并行計算的方式,可以提高系統的計算能力,集中存放和管理,降低單臺工作站的采購數量,降低運維成本。同時充分利用硬件資源,降低能源消耗。林海鑫強調:“這里有一個誤區,有了HPC高性能系統之后,并不是說所有的工作站都不買了,因為前后處理還是需要工程師由電腦去做,高性能計算只是解決了高配的工作站問題。”
第三,計算能源共享。以前,長城汽車的幾十家單位均是各自為政,自己家買自己家的,軟件也是各自部署,這樣的方式造成了很大的資源浪費。通過部署HPC,實現了硬件跟軟件的授權,讓資源統一調度分配,解決了各單位分散購買,不能共享的問題。另外,資源按需分配,對用戶來說相當于一個小型的應用,特別方便。
長城汽車走過的HPC曲折路
回顧HPC的建設歷程,林海鑫用了兩個字來表達:艱辛。
眾所周知:HPC投資大,技術復雜,涉及面廣。因此,長城汽車首先確立了HPC的建設原則是:穩定、可擴展、可兼容,先把基礎架構搭起來后期再逐步擴展的原則。其步驟是:
首先,長城汽車邀請了國際知名的硬件廠商來做交流,但硬件廠商交流的內容是架構、是硬件。但具體到該怎么建?建什么規模等問題時,他們告訴林海鑫“你得主要參考軟件,因為不同的軟件對硬件、對中間調度的需求是不一樣的,各種顯性和隱性的條件是很復雜的。”
第二步長城汽車找到了軟件廠家,但軟件廠家給林海鑫說了很多很炫的理念,問軟件廠家到底應該怎么建時,軟件廠家說“你們問問硬件廠家,因為中間有一個調度層和并行層”。
第三步,長城汽車最后又找到了中間層,他們又告訴林海鑫,調度和排隊都需要。但被問到應該怎么建HPC,中間層方案說“你得問問硬件和軟件。”
HPC四種能力:底層硬件能力+中間調度運行能力+應用軟件能力+專家團隊能力
最后,還是通過好多輪的交流,林海鑫發現這三個方面HPC都離不開。通過梳理,對HPC的要求是既需要具備底層的標準硬件,還需要具備中間的調度和運行,同時還需要了解應用軟件的專家團隊,這支團隊需要較強的技術能力。事實證明,長城汽車在后期部署上線應用軟件的時候,的確遇到了應用軟件廠家搞不定的情況,而最終依靠HPC的技術專家解決。
長城汽車HPC項目第一期于2014年底上線,后期又進行了第二期、第三期。長城汽車計算資源的發展史從2000年左右開始,組建了第一個仿真研發集群; 2005年用16臺塔式服務器搭起了一個新的集群,直至2015年光榮下崗。2016年長城汽車進行了第一次集群升級,2018年進行了第二次集群升級。升級后,長城汽車HPC集群在碰撞和研發仿真方面,計算能力平均提升可以達到4倍,單日作業量提高6倍,研發速度能整體提高3倍。在流體研發仿真方面,計算能力平均提升2到6.3倍,較以往單機計算有了根本性改變,極大地提升了產品研發的周期,簡化了日常管理和運行維護的工作。
據了解,長城汽車HPC平臺上應用的車型基本上包含了長城的全系,哈弗、H系、最新發布的F系轎車以及WEY豪華品牌,甚至是未來長城汽車跟寶馬的合資光束,還有XEV這種清潔能源汽車等,都是利用聯想HPC平臺在研發。
HPC的選型策略
林海鑫在接受采訪時談到, HPC投資大,技術復雜,涉及面廣,選型困難,我們在造型過程中也異常慎重。HPC解決方案商既需要具備底層的標準硬件,還需要具備中間的調度和運行,同時還需要了解應用軟件的專家團隊,這支團隊需要較強的技術能力。而選用聯想HPC平臺,原因有三:
第一,聯想有一個完整的體系,從硬件到中間的并行調度到技術團隊對應用軟件的把控跟能力都比較完整。
第二,聯想的技術團隊很強。
第三,聯想是商業化運行的企業,對我們而言有信譽。