研究人員寫道,之所以選擇1年死亡率作為預測窗口,是因為它將允許與其它研究進行比較,而且它將考慮在兩年內,多次接受與急性髓系白血病相關的ICU治療的患者。
對風險評估,需要手動計算,而基于機器學習的預測死亡率等疾病的結果可以用來節省時間和提高預測精度,他們寫的一篇論文中(在ICU患者急性心肌梗塞和心肌梗死后綜合征,構建計算模型來預測一年死亡率)。本研究建立并評價各種機器學習模型,預測急性心肌梗死或心肌梗死后綜合征患者一年的死亡率。
為了收集數據集,論文的作者們從麻省理工學院計算生理學實驗室維護的免費重癥護理數據庫模擬-iii(模擬-iii)中獲取數據。模擬-iii包含來自4萬名患者的5.8萬例住院病例。他們通過選擇已被證明是死亡率預測因素的特征(如腎功能和肝功能、入院、人口統計學、治療、評估長期和短期總體健康的實驗室值以及各種心臟標志物),將研究對象的數量減少到5037名 。
最后,研究小組決定根據這些確診為急性心肌梗塞或經前綜合癥(PMS)的患者的數據進行分析,經前綜合癥與心悸有關,而非個體。這是因為在某些情況下,病人在一次住院中存活了一年,但在另一次住院中卻沒有存活一年。
研究人員對這些記錄進行預處理,以刪除重復記錄、對相同的輸入、數據輸入錯誤和異常值進行多次處理。 在一臺搭載2.2GHz Intel Core i7處理器的PC上,使用谷歌開源TensorFlow框架,團隊對其屬性選擇分類器、回歸分類等十余種分類算法進行了訓練。
在測試中,兩種人工智能模型,邏輯模型樹(LMT)和簡單的邏輯算法表現得比其它模型更好,在從數據集(1629人)中識別30%入院一年內死亡的患者方面,準確率達到85.12%。(第三種算法J48緊隨其后,準確率為84.88%。)有趣的是,深層神經網絡模型在識別一年內死亡病人的能力上,優于所有機器學習算法,該模型具有多層數學功能,可以模擬人腦中的行為神經元。
研究人員寫道,這反映了數據科學中的一個共識,即沒有一種普遍適用的算法一直優于所有其它算法。有許多因素可以影響心肌梗死后的死亡率。找出利用這些因素信息的方法將有助于準確預測可能的結果。
這篇論文的作者指出,數據集是這項研究一個限制因素,實驗室和圖表值缺失等數據缺口,也是一個限制因素。但他們認為,結果表明,正確診斷和治療急性心肌梗塞對1年死亡率有明顯影響。他們寫道,從這個數據集可以看出,并沒有特定的因素提供了所需的可預測性信息,同時能包含所有相關標準,可以改善預測。利用機器學習獲得更好的可預測性,可以幫助高危患者努力遵守治療計劃,以提高死亡率風險。