以下是現場速記。
浪潮信息 方案與測試部總經理 企業推進部總經理 劉志勇
劉志勇:各位領導、各位嘉賓,大家上午好!壓力很大,剛才劉總講了詩,韋總講了宇宙,除了詩歌就是遠方。我今天要講的內容是數據中心,我們講的是很實際的基礎性的工作。
兩會剛剛結束,比較去年新基建和今年十四五的國家政策,國家政策上講得很明確,去年新基建時提的是信息的基礎設施、創新和融合的基礎設施。它的基礎是在算力、5G和新技術,這是去年的概念。到了十四五進一步又強調了一下,科技創新把人工智能排在了第一位,這是整個中國的政策環境。這個政策環境,基本上已經很明確的指明了國家經濟發展的方向,就是往數字化的方向、智能化的方向去轉型。
除了外部環境、政策環境之外,還有企業內部的驅動力,特別是大型企業跟超大型企業內部驅動力。
它會體現在哪里?從去年貿易戰開始一直到近兩天的棉花問題,外部環境變化導致國內所有大型企業有核心競爭力的有核心技術的企業越來越關注自己對核心競爭力的發展以及追求方面的保護,國家投資也在進行引導。
同時由于中國互聯網應用技術是全世界最好的,所以在智能經濟以及顛覆性的業務模式、商業模式上在中國受到的關注度也會比其他的國家高很多,這是我們看到由于外部的環境的變化導致企業內部對數字經濟轉換的驅動力。
還有一個是來自于企業內部的,技術手段變化了,設備變化了,我們看待IT角度也產生了變化。會體現幾個地方:
第一,技術業務戰略。
最早的技術業務戰略發生在互聯網的這些公司,我們看到不管阿里還是頭條等,基本上都是靠自己的技術創造了一個業務模式,所以在某種程度上技術確實是代表了某種業務的戰略。
第二,技術人員越來越多不是支撐的工作。
我們回想20年前的時候,當時不叫數據中心,很多單位叫機房。機房工作人員主要做的是支持的工作,支撐性的工作。現在不一樣了,現在越來越多的IT技術人員變成了業務的合作者,他在跟別人合作。如果沒有IT支持,可能很多業務無法上線也無法維持。
接下來是敏捷開發。
比如我們說敏捷開發去年春節的時候,當時初二因為疫情原因要待在家里,盡量少出去。到大概三、四月份時候陸續開始出差,五月份國內出差比較普遍,六月份基本沒什么大限制了。這個業務的上線用了多長時間?是全國性的上線,跟蹤每一個人行蹤、交通、乘車軌跡,用了幾周的時間就上線了。
我們這個例子很典型,因為它是全國性的應用上線了,只是幾周的時間。所以敏捷開發推動的一定是企業文化的轉變,還有人工智能帶來的顛覆性的業務。
這是我們能看到企業的內因,有政策環境變化、政策指導還有企業發展數字化轉型內部的驅動力。
所以CIO會越來越多的和CEO、CFO共享視角,大家看到的是同一個角度,用IT的方式去從另外一個比如報表、BI等等角度去看待一個企業的業務,越是大型的企業這方面的表現就會越明顯。
政府在前幾年提到強政、興業和惠民。一方面跟國家有關系,還有跟制造有關系,和老百姓生活有關系,每一部分最后處理的都是數據。比如從強政角度來看,為什么成立大數據局?某種程度它是做數據融合,為什么跑一次就把所有事辦完,因為數據是打通的。可是數據打通以后,最后在根本上還是要去運算,因為單獨給你數據是沒有意義的。就好像我們在機場也好還是在高鐵也好,它給你監控每人面部,如果看到有發燒跡象就單獨挑出來。面部識別不重要,關鍵的是要挑出那個人他可能在發燒,可能體溫過高。在數據卵生在老百姓日常生活中這個體現就更加明顯了。
我們引用了兩張圖,兩個統計:2021年到2025年全球數據增長量大概是接近4倍,從44zb漲到163zb,差不多是四倍的增長。數據來自人工智能、容器、大數據、IoT還來自于從模擬到數字的轉變以及云計算產生的相關數據,是四倍。但是我們在看對計算力的要求,數據增長是四倍,對算力要求增長是多少?AI算力過去六年時間30萬倍,所以從計算的角度來講,我有這么多的數據,就意味著你一定是幾何級指數往上增長的對計算力的要求。這是我們今天談數據中心要改革、要更新,要有進一步升級的原因,基礎就在這兒。
傳統的數據中心,我們把它簡化成最最簡單的句子來看。傳統的數據中心,技術上的叫法叫記錄型的系統,這個是專有名詞。它的體量基本上是TB級到PB級的,正常情況下哪怕一個比較大型的企業如果它的業務數據,基本超過TB的都不是很多,PB級指的是什么?比如說他要做科學運算或者做影視動漫渲染,這種情況下他們有些時候做的運算量或者數據量會達到PB級,但基本到PB級都差不多了,傳統數據中心大概的數據體量就是這么大。
它的運行方式,它是有計劃、有流程的,它是按照程序在走,是事先預設好的,所以它沒有太多的智能化的控制,除非人為控制。架構最早是物理機,后來在七八年前轉移到虛擬機。這是我們看到的傳統的數據中心,新一代的智慧化的數據中心改變在哪里?
第一,它的功能是變成了數據智能,帶有智能特征的數據,它的體量慢慢會變成EB級。運行是按需的,敏捷有智能化、有彈性的會做一定預測性,它跑的應用和程序會有一定的預測性,它的架構是一個平臺性的架構。這個就是我們浪潮主要在推的概念就是智算中心的概念。
智算中心首先解決的是算力的問題,未來企業、政府對算力要求會非常高。
第二規模化的問題,它越來越標準化,越來越模塊化,支持規模化的擴展。現在超大規模數據中心基本出現在互聯網。
還有綠色、節能。如果大家看新聞,大概兩周以前,我們國內挺火的有一個公司的運算,他們把機房都放到了內蒙,那邊電力會好一點。但是兩周以前,政府要求全部都拆掉了,都挪到了其他地方,因為電力中心不夠了。
去年全球數據中心用電量大概相當于瑞士一年整個國家的用電量,所以我們未來在節能上肯定會對數據中心提出特別高的要求。
還有云的管理、數據、海量數據的涌入、大數據的整合還有深度學習的算法。這個是我們從傳統數據中心向智算中心的演進。
我們去年11月份和國家信息中心聯合發布了《智能計算中心規劃建設指南》。為了發這個指南,我們浪潮做了很多年的技術上的儲備、方案的儲備、產品的儲備、技術的儲備,我們參與了幾乎所有的開放組織。我們牽頭和參與了國家級GB國標的制定。
我們發布了很多的行業指南,這些都是浪潮在實際的工作當中過去這些年的積累。今天我們講智算中心,我們沒有這方面的產品技術跟方案的積累,我們就很難推動這個概念。所以為什么跟國家信息中心發布這個東西,這是基礎的原因。
這一頁PPT講智算中心建設模型,中間部分是跟傳統的數據中心架構差不多,沒有本質區別。只不過下面的平臺變成了云,變成了異構云、中心云、邊緣云,上面跑的是硬件,再上面是操作系統,再上面是云、數據和人工智能,最上面是各行各業的應用,這個是它基礎的結構。
特征是敏捷,要分層解耦,有開放的標準。因為時間關系,后面無法展開了,其實這一頁邏輯是很復雜的。
我們分開人工智能、云和數據單獨給大家再稍微展開一下,因為這個概念挺復雜的。
首先,我們看一下這幾年深度學習對算力的要求,早些時候1940年年代主要做彈道導彈計算,最簡單的是狗追兔子。
第二個是深藍擊敗世界象棋大師。
第三是深度學習、系統能力包括無監督訓練、遺傳密碼、模式識別、訓練、推理、完善。
如果我們要把智能運算當成一個話題,它至少要有四部分:
第一部分,算力從哪產生的?我們基于浪潮自己的設備可以看到,比如說AGX-2全球最高密度的計算,還有全球最快的人工智能運算服務器。產生的運算之后,我們把運算聚合起來就是強大的數據化平臺,然后要把計算力調度好,因為現在是虛擬化平臺、云的平臺,并不是看單機運算能力,而是整個系統、數據中心擁有的計算力,這就帶來怎么把計算力放在合適的地方問題。所以我們有AI進行調度,最后實踐時Alstation是浪潮自己開發的中間件將算力釋放出來,將產生出來的算力放在一起最后調度它,最后把它調度到需要算力的那個應用。
我們再提一下數據,我們以前看到的數據,特別是數據中心大部分看到的是業務數據。但今天的情況肯定有非常大的變化,首先第一個先增加了人類的數據,比如說人的行程軌跡、每天心跳走的步數,現在有專門設備進行收集數據,但幾年前可能還行,這個數據庫越來越多,同時機器會產生很多數據,這就是5G應用最基本的基礎就是來自設備的數據,比如攝像頭。它會最后形成統一的數據湖,這是第一海量多,第二多源,它有很多地方產生數據,現在是產生數據能收集,異構就是有結構化、非結構化、半結構化,所以現在任何一個企業面臨的數據都比以前要復雜,以前更多關注在業務數據上。
大數據第二部分是從最早國內數據是從數據生命周期的管理,因為這個東西它會消失的。比如我們說一段小區的安保視頻拍下來之后以前基本存三個月,三個月后數據就消失了,這些數據不會再保留,不會備份,這個數據就是基于生命周期的管理。現在它逐漸向數據湖發展,最終發展到數據器,它會變成更龐大的體系。它的數據來源主要是端、邊、心、云。
站在云計算的角度,簡單看一下。第一代單體結構,第二代以服務為核心的架構,第三代是微服務架構,圖并不復雜,但是演進的路線是非常明確跟準確的。
云計算最終導致的結果是我們會脫離原來數據中心對操作系統的依賴,它越來越多的會到容器上去。因為我們以前關心系統,現在越來越多關心的是應用。我們有了容器技術以后,很多微服務就會成為現實,最終我們的整個敏捷開發、敏捷的業務上線等等這些都會變成現實。
剛剛我們談了智能運算、大數據和云。剛剛微軟的韋總也講了,關于智算中心操作系統,最后一定是融合在一起的就是云數智融合在一起的,它最后的操作系統跟我們原來所理解的操作系統有很大的差別,它演進的過程也是從傳統的開發部署到微服務到云數智的融合。
傳統的數據管理是從數據庫直接演進到統一的大數據平臺。管理層是最下面的傳統IT到逐漸的軟硬件的解耦,然后逐漸變成資源池化,最后整個IT服務變成完整的云,當然它是多云可能是異構的。
我們再簡單說一下關于智能應用這一層,因為最后數據中心還是要用的,我們建那么好的數據中心,花那么多錢,去將它升級。升級完以后,首先它有一個平臺,AI算力平臺調度、算法以及優化引擎這些是基于AI計算的。有了這個平臺之后最后會到行業智能應用,例如設備健康管理、智能質檢、影像識別、商業決策、智能客服等。
有了智算中心之后最終要跑應用,這張圖我引用的是浪潮軟件常用的一張圖,這個圖其實挺典型的,它的說的意思是底層的智算中心基礎上,上面的數據中臺和業務中臺,再上面是基于應用的各種云,各種微服務,在上面跑的是大家最常見的電子采購、供應鏈等等,最基礎的部分在智算中心上,然后是在整個中臺上,這是浪潮能提供的落地的實際案例。
這一頁PPT是基于工業互聯網的,我們不做詳細的解釋了,這張圖我引用的是浪潮的云服務BG一張常用的圖,我們舉了兩個例子,一個站在企業的角度整個未來的架構是什么樣的,底層還是智算中心,另外一個是站在工業互聯網的角度上未來的應用架構大概是什么樣的。
這一頁PPT是浪潮提供的應用智算中心、云州大腦、QID云ERP全堆棧能力,基于工業互聯網上我們的智算中心架構體系是什么樣的。
你怎么建設智算中心?最后數據中心是物理的形態,它也許是個樓。最終分成七個部分:機房、算力系統到云化的經營到智算的平臺而且還要安全可控,包括目前在央企里還有信創的要求還有智能管理和智慧化和外界的連接。
這個論證我只拿了一頁PPT,這個文件是200頁,歡迎各位領導到浪潮參觀,到那時如果需要的話,我們會有很詳盡關于智算中心如何落地的解釋。
這一頁PPT是我們在國內的重要客戶,基本上央企占了大部分。
最后我再總結一下,整個智算中心未來的新一代的數據中心升級,智算中心的路徑最基礎的工作就是云化,所有的設備需要云化。關鍵是把所有數據放在一起,達到的目標是提升整個智算中心對業務的影響以及提高運作的效率,達到整個系統或者讓整個企業變成智慧化的系統、智慧化的計算中心、智慧化的企業。
以上就是我今天的分享,謝謝各位!