互聯互通是基礎,定制化服務是中心,懂數據會分析是關鍵。
什么是大數據?什么是數據?什么是資料?資料就是生產過程、管理過程,乃至經濟、社會、生活過程的記憶,那些記憶可能表現在一個文件、一段演講、一段文字上。資料放在計算機里就叫數據,所以數據是指以編碼形式存在的信息載體。真正的大數據是指大而復雜的資料集,包括了海量性、時變性、異構性、分布性等特點,是我們從互聯網的數據中能夠觀察到的特征。只要數據量超過臨界量,就叫大數據。
大數據離不開互聯網。近幾年,互聯網的發展走向是從復雜信息傳遞到消費互聯,再到生產互聯也就是物聯網,然后到智慧互聯。其實,這些新技術都是信息技術的一個層面,真正產生效益和作用的是所有技術的綜合運用。
互聯網和云計算是基礎設施,物聯網是交互方式,人工智能是應用模式,大數據是最底層的信息技術,任何工業要實現“兩化”,任何政府要實現科學決策,大數據是基本標配。
那么,應該如何運用大數據呢?首先,明確目標是前提。這是推出大數據產業最重要的一步。其次,擁有數據是基礎。沒有數據就談不上大數據產業。再次,計算平臺是支撐。沒有一定的計算架構和平臺就無法計算。此外,分析技術是核心。這是當今較少提到的一個主題,在整個大數據鏈條中,有些鏈條做得過分粗壯,有些鏈條過分纖弱,即產業鏈布局不均衡。如果過分膨脹,將會產生新的產能過剩。最后,產生效益是根本。
大數據可以帶來超凡價值。在這個過程中有很多觀念要改變,要認識到數據是資產,用戶是資源,服務即感知。大數據突飛猛進地發展能夠解決相當多的問題,但仍然存在挑戰。主要是分析基礎被破壞、計算技術待革新、真偽判定需要重建以及對新技術的盲目所引起的盲從。總體來說,仍需集中力量攻克挑戰,大數據的發展才能有大的突破。
繼互聯網之后,真正能夠對企業產生重大影響的就是大數據。同時,要將大數據與其他技術相結合。現在人工智能潮正在到來,在可見時間內,人工智能真正能夠發揮作用的就是數據智能,即大數據。因為人工智能簡單來說可分為兩大類,一類是模型人腦工作機制、行為方式,是仿腦類腦的技術;另一類是快速的認識,因為人腦對大數據的認識本身沒有那么快,但獲取數據的速度極強,可以從數據中分析出人類認識問題特定的方式方法,這就是數據智能,也叫人工智能。
同時,大數據能服務于轉型升級,但我們至少要清楚什么是轉型和升級。工業中的轉型,就是從過去以產品為中心進行組織設計、制造、銷售管理,轉型到以服務和以定制化為中心。
最近有一個基本的觀點說,現在正在從過去的“老三基”——材料、工藝、零部件,轉變為“新三基”——大數據、傳感器和零部件。對一個行業來講,數據的復雜性來源于設計、制造、運行和服務,來源于對每一個數據的仔細分析。由于離散型和連續型并存、數值型和非數值類型并存、結構化和非結構化并存,大數據必須關注完整屬性,必須關注產品全壽命特性,必須關注全方位連接,關注制造系統融合等,這使得我們認為基本難點在認知知識數據。其實全鏈條數據如物理模型的結合,也是技術難點。
大數據是新一代信息技術的基礎性技術,需要推進應用。工業大數據非常有潛力,但一定要解決好定位、規劃、切入點、標準、開發共享等問題。互聯互通是基礎,定制化服務是中心,懂數據會分析是關鍵。