IT治理能力如今似乎特別的供不應求。對賓大醫學院IT領導者Michael Restuccia和Brian Wells也是如此。他們把賓夕法尼亞大學醫學中心帶入了大數據挖掘和高性能計算的軌道。他們認為,這在很大程度上收效于一個不同尋常并且自上而下的治理結構。接下來我們可以進一步了解關于該CIO團隊通過有效治理收獲的突破性工作和大數據優勢。
幾周后,賓夕法尼亞大學醫學院首席信息官Michael Restuccia和衛生技術和學術運算助理副總裁Brian Wells,將使來自被稱為PennOmics的倡議組織的第一個數據量達到TB級別的數據庫成為現實。作為全國范圍內極少數的此類數據庫, PennOmics研究數據庫結合了從醫療中心臨床試驗管理系統得來的病人護理信息和研究實驗室的癌癥基因組學數據。隨著感恩節的到來,研究人員將能夠在自己的實驗室通過互聯網連接來訪問數據。他們將能夠就數據進行提問,假設測試,并希望能夠探索到新的籌資機會—包括與業界合作伙伴的臨床試驗,或者獲得更多的聯邦補助金。
“這是一個非同尋常的舉措,”Wells說。沒有多少學術醫療機構有臨床系統和足夠的研究分量來推出一個這種規模的數據項目。賓夕法尼亞州衛生系統大學在東南賓夕法尼亞州和新澤西州南部的部分地區擁有四家醫院, 2000多名醫生和6,000名臨床醫生。成立于1765年的全國第一所醫學院-佩雷爾曼醫學學校,擁有1,000名教師和800名學生。 PennOmics卻有一些不以規模而論的東西,Restuccia和Wells解釋說。
賓夕法尼亞大學的醫學院和醫療系統均向同一個實體負責,醫學院長辦公室。在實驗室進行的研究會被集成到病人的護理中——這是賓夕法尼亞大學醫學院提供 “精準醫療”的承諾, Restuccia說。這個任務的背后,是被稱為高級IT治理委員會的一個強大集團。該委員會每月至少會面一次來討論技術要求,計劃,項目現狀,挑戰和目標等。
“最高管理層由醫學院和衛生系統的領導者構成,”和Wells一起作為該領導層必然成員的Restuccia說。 “有十二個人進行概覽和監督,并向我及Brian和其他人指明我們需要行動的明確方向。 ”
所以,因為PennOmics項目, 在Restuccia和Wells從整個賓州系統搜出半打不相關遺傳學數據之前;在Wells一個一個實驗室向心臟科,腫瘤科,神經科醫師們和其他專家推銷分享數據的價值之前;在與甲骨文公司合作來微調廠商的基因數據模型之前;實際上,在他們購買甲骨文轉化研究中心的硬件和軟件套件之前,這兩位IT領導者很大程度上依靠該委員會的“集成領導方法”。
一個擺在PennOmics倡議組織面前的緊迫問題是,例如,到底是購買還是建造研究數據倉庫的軟件。委員會認為該項目是對賓州醫學使命至關重要的,所以做了購買的決定。從合同談判到實施花了九個月時間,Wells說,相對于采取內部開發系統可能需要的多年時間。
治理委員會的介入也從該項目的其他方面證明了其重要性。PennOmics數據庫的一個創新是,它就會從不同的來源獲取數據。大約三分之二的數據來自現有的IT團隊已經維護了六年的病人護理數據庫。其它數據來自IT知之甚少的環境- Penn研究實驗室的分散化世界,其中的數據往往是雜亂無章的,而其接入途徑相對協作來說更為“自我”。 “他們有很多善于收集信息和存儲信息的系統,但卻沒有方法來共享信息,并鏈接回衛生系統的數據庫,”Wells說。
Restuccia說Wells加快研究系統和文化速度的能力非比尋常,對濱州醫學來說是一個“巨大的區別”。但是,一個背負如此多希望的項目,不單單需要快速的學習。
“它需要治理的原因是因為我們從衛生系統和研究方面都要獲取數據, ” Restuccia說。 “我們必須獲得領導者的資源來創建它,以及貢獻數據和支持整個決策。 ”
非但沒有成為IT的拖累,治理不僅帶給了賓夕法尼亞大學醫學院大數據的優勢,據該CIO團隊說,而且也造就了一個更有效的IT組織。“IT能夠更迅速地能夠定義我們的方向,更有效地利用我們有限的美元,我們在制定決策中不是排外而是更具包容性,” Restuccia說。 “浪費的時間減少了。團隊讓我們專注于最重要的事情。”
集中化方法來進行高性能計算
事實上,這種關系是雙向的。 Restuccia和Wells已經建立起的與醫療保健系統和醫學院的信任關系,使IT挑戰極限變成了可能。
典型的例子是與另一個備受矚目的舉措密切相關的PennOmics研究數據倉庫:賓夕法尼亞大學醫學院高性能計算集群(HPCC)。集成到PennOmics倡議組織的癌癥基因組學數據很大 - 每名患者的基因組大約一兆位元組。 “如果你在臨床試驗中有400名患者而且你在給他們每個人測序- 好吧,管理400 TB的數據對于我們來說是很陌生的,” Restuccia說。也不是由放在研究者實驗室工作臺下的普通電腦就能夠輕易管理的那么大小的數據。瓶頸促進IT推動了利用醫療中心數百名研究人員運行他們算法而實現的校園集中高性能計算中心。 (參見邊欄上的新HPCC能力。 )
該計算集群在2012年春天被購買并于2013年1月投入運營。“我們能夠為客戶更快的提供解決方案,而且比他們自己去做更為經濟,這是一個人們得到共同利益的實例, ”Wells說。
集中式方法還有助于保護包含在數據中的敏感的病人的健康信息( PHI )。大部分的處理在防火墻的后面進行。研究人員有一個“云溢出方案”用來向外擴展,“但我們不允許任何可識別的PHI上傳到云上,”Wells說。讓云服務供應商簽訂的服務水平協議,以滿足賓州醫學嚴格安全要求,以保護此類型數據的艱巨的工作正在進行中。“我們還沒有完成,”他說。
最低層面上說,最大的挑戰是從順序分析儀傳輸遺傳學結果數據到HPCC并進入大型研究數據庫。 “你能獲取的從你辦公室墻壁(或任何你的順序分析儀在的地方)到數據中心的速度是每秒1千兆。這意味著它需要大約三個小時來傳輸一個TB的數據,這可是挺長的時間,”Wells說。IT部門正在與網絡供應商聯系以獲取10甚至40千兆網絡帶寬,以及一次可裝入多達10至30 TB數據的便攜式分析存儲陣列。
該項目再次展現了IT領導治理委員會的價值,不僅由于集中高性能計算集群在整個企業獲得共識,而且把他們的專業領域知識帶入IT項目。