“中國青年生命體制數據庫”大數據平臺
---醫學中的“大數據”與“小數據”
摘要:大數據必須來源于小數據,目前被奉為神靈的
“大數據時代”,大數據分析、大數據挖掘、大數據研究、大數據平臺、大數據 是生產力等等。似乎可以解讀一切,尤其是醫療領域,醫學統計學被奉為“科學證據的代名詞”。殊不知,標準化及科學化采樣,并獲得個人準確的小數據更是急需 完善的基礎。國家科技基礎條件平臺“中國青年生命體制數據庫”大數據首席專家新宴教授強調,要跟蹤個人的“小數據”, 可穿戴設備,移動技術將可以連續、方便、安全地收集、整理、儲存分析個體的數據,這些數字追蹤將得到一幅只屬于個體的自畫像。而個性化的診斷治療都需要記 錄和分析個人行為隨時間變化的規律,這就是“個體化小數據”。在健康管理中你就可以橫向和大眾比,縱向和自己比,隨時發現自己的變化,調整自己的生活方 式,使自己健康平安。
========================
文字:王新宴教授 國家科技基礎條件平臺“中國青年生命體制數據庫”大數據首席專家,空軍總醫院特診科主任
現在是“大數據時代”,大數據分析、大數據挖掘、大 數據研究、大數據平臺、大數據是生產力等等。好像大數據可以解讀一切,尤其是醫療領域,醫學統計學被奉為“科學證據的代名詞”,科研文章、循證醫學、診斷 標準、藥物評價等等,“言必提大數據,證據來源于醫學統計學”。甚至中醫辨證也搞大數據,也靠醫學統計學佐證。
但是,人體不同于“零件”,統計學中假設N1=N2=。。。Nn,人體卻非如此,每個個體都有特殊性。我不否認大數據,統計學可以發現概率。我提醒要正確理解醫學概率問題,要知道什么是大數據,100萬人的本底是不是大數據?100萬人是不是就代表了10億人?是不是就代表了50億人?況且,很多研究僅僅有幾十人、幾百人的本底。我提醒的是要正確的認識統計學中概率與個體之間的關系,概率是橫向比較,個體化數據才是每個人的!
有專家提到“小數據”概念,小數據就是個體化的數據,是我們每個個體的數字化信息。例如:你的孩子每天都喝牛奶,突然有一天喝完牛奶出現不適,這一天喝的牛奶是個新牌子,可能就是喝了這個新牌子的牛奶讓孩子產生了不適。這就是孩子成長中的“小數據”,醫療中“小數據”非常重要。曾經的一個病人反復出現皮疹,最后診斷為花生過敏,確診實際上是依靠家長記錄孩子飲食發現的。“小數據”不比大數據那樣浩瀚繁雜,但對個人卻至關重要。
目前,大數據正在改變當代醫學,高血壓診斷標準、骨質疏松診斷標準、藥物評價、醫療設備溯源、基因診斷等等都離不開大數據。但是臨床診療中個體化數據更為重要,用“個人小數據”和大數據比較的同時,要跟蹤個人的“小數據”,可穿戴設備,移動技術將可以連續、方便、安全地收集、整理、儲存分析你的數據,可以包括你的工作、購物、睡覺、飲食、感覺、情緒、鍛煉、通訊等等信息,這些數字追蹤將得到一幅只屬于你的自畫像。
個性化的診斷治療都需要記錄和分析個人行為隨時間變化的規律,這就是“個體化小數據”。在健康管理中你就可以橫向和大眾比,縱向和自己比,隨時發現自己的變化,調整自己的生活方式,使自己健康平安。
國家科技基礎條件平臺“中國青年生命體制數據庫”大數據首席專家新宴教授強調,我們不是說大數據不重要。醫 學上發現問題、制定診斷治療標準、藥物評價等等都需要大數據。歐美等國家早已開始建設患者信息數據庫。我們正在建立的“生命信息保險箱業務”就是用戶可以 通過存儲自己的“個體小數據”,不斷完善自己的健康自畫像。而我們集成大量在線數據建立的數據信息平臺可以推動個體化診斷治療,正確判斷,減少誤診,避免 過度診療和診療不足。也就是“從大數據得到規律,用小數據去匹配個人”。