普渡大學(Purdue University)的數(shù)據(jù)科學和機器學習創(chuàng)新者希望幫助組織和用戶從基于云計算的數(shù)據(jù)庫中獲得很大收益。當?shù)却龝r間是主要問題時,其相同技術(shù)可以幫助自動駕駛車輛在道路上更安全地運行。
普渡大學農(nóng)業(yè)與生物工程學助理教授索Somali Chaterji負責細胞和神經(jīng)機器創(chuàng)新[ICAN]的研究,她的團隊創(chuàng)造了一種稱為OPTIMUSCLOUD的技術(shù)。
對云計算供應商和客戶均有利
該系統(tǒng)旨在幫助實現(xiàn)云計算托管數(shù)據(jù)庫的成本和性能效率,對資源進行合理分配,以使那些不必為故障安全操作而積極地過度為其云托管服務器提供過多服務的云計算供應商以及客戶受益,因為可以將數(shù)據(jù)中心節(jié)省的成本轉(zhuǎn)移到他們身上。
Chaterji說:“這還可以幫助正在遠程數(shù)據(jù)中心處理研究數(shù)據(jù)的研究人員,而在疫情期間,遠程工作條件使吞吐量成為首要任務。這項技術(shù)源于提高數(shù)據(jù)管道的吞吐量,以處理微生物組或元基因組學數(shù)據(jù)。”
該技術(shù)可與三個主要的云計算數(shù)據(jù)庫提供商一起使用:亞馬遜的AWS、Google Cloud和Microsoft Azure。Chaterji表示,將在工程方面與其他更專業(yè)的云計算提供商(例如Digital Ocean和Floyd Hub)合作。
它以NoSQL技術(shù)Apache Cassandra和Redis在亞馬遜的AWS云計算服務上進行了基準測試。
Chaterji說:“通過優(yōu)化本地或云托管數(shù)據(jù)庫的使用方式,幫助企業(yè)很大程度地發(fā)揮作用。這不再只是計算上的繁重工作,而是有效的計算,企業(yè)可以使用所需的東西并為使用的東西付費。”
處理長期運行的動態(tài)工作負載
Chaterji說,當前使用自動決策的云計算技術(shù)通常僅適用于短期和重復任務和工作負載。她表示,她的團隊創(chuàng)建了一個優(yōu)秀配置,以處理長期運行的動態(tài)工作負載,無論是來自連接農(nóng)場中無處不在的傳感器網(wǎng)絡的工作負載,還是來自科學應用程序的高性能計算工作負載,還是來自于計算機不同部分的當前疫情仿真。急于尋找抗冠狀病毒的方法。
Chaterji說,“隨著在云平臺上運行的無數(shù)應用程序,數(shù)據(jù)的多樣性以及從數(shù)據(jù)中獲取洞察力所需的算法以及隨之而來的,需要擁有異構(gòu)服務器來分析數(shù)據(jù)的成本顯著不同的情況,我們正確調(diào)整大小的方法變得越來越重要。”
Chaterji說,“Amazon EC2上按需實例的價格相差五千倍,這取決于企業(yè)使用的虛擬內(nèi)存實例類型。”OPTIMUSCLOUD對于無人駕駛車輛(延遲是優(yōu)先考慮的),醫(yī)療保健存儲庫(吞吐量是優(yōu)先考慮的)以及農(nóng)場或工廠的物聯(lián)網(wǎng)基礎(chǔ)設(shè)施中使用的數(shù)據(jù)庫具有眾多應用程序。
OPTIMUSCLOUD:使用機器學習和數(shù)據(jù)科學原理
OPTIMUSCLOUD是與數(shù)據(jù)庫服務器一起運行的軟件。它使用機器學習和數(shù)據(jù)科學原理來開發(fā)算法,以幫助共同優(yōu)化虛擬機選擇和數(shù)據(jù)庫管理系統(tǒng)選項。
Chaterji說,“而且在疫情時期,當我們和濕實驗室這樣的傳統(tǒng)計算密集型實驗室都依賴于計算存儲,例如對疫情的傳播運行仿真時,這些云托管的虛擬機的吞吐量至關(guān)重要,甚至利用率略有提高可帶來巨大收益。考慮到目前,即使是最好的數(shù)據(jù)中心也只能以低于50%的利用率運行,因此,傳遞給最終用戶的成本將顯著增加。我們的系統(tǒng)會查看數(shù)百種可用選項,并確定按美元成本歸一化的優(yōu)秀選項。在云數(shù)據(jù)庫和計算方面,當只需要一個輪胎時,尤其是現(xiàn)在每個實驗室都需要一個輪胎才能行駛時,并不想購買整輛汽車。”