前言:關于大數據常常出現在那些創業故事的結尾,比如進行大數據挖掘,潛力無限。那聽起來特別像 “王子與公主從此過上了幸福的生活”。其實言下之意有兩個:①大數據這個事兒現在還沒做;②大數據屬于更高級別的應用。
關于大數據的應用,腫瘤治療和預防恐怕意義更加突出。腫瘤是一種高度復雜和個性化的疾病,急需更為精準的治療手段,而大數據分析無疑提供了非常有利的武器。那么大數據在腫瘤治療領域的可以如何施展?又會面臨哪些困難?以及前景究竟如何?
一大波癌癥在靠近
看到過這樣一個數字,經過人類社會的努力,癌癥在過去 50年 的治愈率僅僅提升了不到 8%,是所有疾病中提升最慢的一種。無論這個數字靠不靠譜,癌癥起碼到今天仍是一種極為恐怕的疾病。即便是美國這種傳說中癌癥 5年 生存率很高的國家,也會有安吉麗娜.朱莉這種為了避免不確定的風險而切除乳腺的事件。
也是在近幾年,環境惡化、人口老齡化、醫療負擔、不健康生活方式等因素都促使我國的公眾和輿論對癌癥的關注越來越多。
對于普通人來說,發病率和死亡率是兩個最直觀、最容易理解的概念。就在這兩天,丁香調查編譯了一篇 2016年1月 份發表在《CA:A Cancer Journal for Clinlicians》上的文章,披露了我國各類腫瘤疾病的發病率和死亡率。這應該是有關中國癌癥領最新的研究文章了,而該雜志的影響因子是 144.8(翻譯:相當權威)。
這篇文章題為《Cancer Statistics in China, 2015》,是由中國醫學科學院腫瘤醫院、國家癌癥中心赫捷院士、全國腫瘤登記中心主任陳萬青教授等人撰寫的。
就是這篇文章提供的數據顯示,2015 年中國預計有 429.2 萬例新發腫瘤病例和 281.4 萬例死亡病例,相當于平均每天 12000 人新患癌癥、 7500 人死于癌癥。男性所有腫瘤發病率 2000 年至 2011 年略顯穩定(年增長 0.2%),女性則較為顯著(年增長 2.2%),癌癥死亡率從 2006 年以來出現顯著下降(男女分別年降低 1.4% 和 1.1%)。
但我國癌癥的現狀仍然非常嚴重,已經嚴重到什么程度?2015年9月,國家 16 個部位專門就癌癥防治出臺了三年防治行動規劃,并在規劃中對我國的癌癥形式做了兩個方面的定性:①是導致我國居民預期壽命受損、因病致貧、因病返貧的主要疾病,②已成為我國面臨的重大公共衛生問題之一。
目前人們已經充分認識到,早期篩查以及改變不良生活習慣對癌癥防治的重要作用。美國頂尖的癌癥中心做過一項研究,外在因素占癌癥發病率比例的 90%~95%,而其中,濫用煙草占 25% ~ 30%,不良飲食和肥胖占 30% ~ 35%,單純僅此二項之和就占據 55%~65%。所以,癌癥這種疾病充分說明了 “no zuo no die”!
不過,對于最終阻止一種疾病而言,治療仍然處在非常核心的地位。但癌癥本身是一種高度復雜且高度個性化的疾病。不僅癌癥的種類非常多,而且即便是同種癌癥也會分為很多類型,而這些類型又受每個患者自身因素的巨大影響。所以,癌癥治療是個對精準醫療、個性化醫療需求非常高的領域。(部分癌癥是由于某些特定基因高頻突變所致,但更多癌癥是由很多的發生概率極小的基因突變所致。資料來源:CSDN)
“ 上個世紀 90年 代開始循證醫學逐漸代替經驗醫學成為臨床研究與實踐的主旋律,” 在采訪最一開始,新嶼信息創始人兼 CEO 季春暉說我們先要就此達成一個共識,“ 現在隨著計算機網絡技術的發展和大量醫學數據信息的出現,我們進入醫學大數據的時代。尤其是人類尚未完全攻克的腫瘤,對于結構化醫學數據的需求尤為迫切。腫瘤大數據能從流行病學、治療、預后等等方面對腫瘤預防診治提供前所未有的幫助,并且與精準醫療的結合更是讓我們看到攻破腫瘤的新希望。”
正是基于這樣的思考,季春暉于 2013年 創辦了新嶼信息,針對腫瘤臨床科研數據管理和患者管理的兩大需求,致力于為醫生提供臨床腫瘤高效科研及患者管理的解決方案。
大數據的醫療應用
大數據早已是人們耳熟能詳的概念,而關于它的應用場景,很多人也都會有一些模模糊糊的概念。其中最典型的一個就是在電商當中,根據用戶的偏好為用戶推薦可能青睞的商品。而在醫療領域,人們關于大數據的應用也早已施展了充分的想象。
大體上在創業公司里面,這些應用場景包括兩個方面:
①在健康管理和疾病管理領域,通過智能設備對每個用戶的某個或多個數據進行監測,幫助醫療機構或健康管理機構能夠更全面、精準的掌握用戶的健康狀況,并在某個數據異常時向用戶發出預警;
②在基因監測領域,基因公司通過基因檢測能夠幫助用戶在基因層面更加精準的了解自己的 “過去、現在和將來”,并基于潛在可能存在的風險,為用戶提供相應的健康管理服務,以避免疾病的發生。
雖然這些設想中的場景尚未完全到來,但從中可以看出,人們已經充分認識到了大數據能夠給醫療帶來的益處。而且,如果有人心懷理想,這種益處甚至可以超越商業利益本身。也許腫瘤治療是實現這種理想再合適不過的領域,但有可能面臨的困難也相當大。
①需要打破重重壁壘受限于傳統醫療體系,醫療信息往往被封閉在一家醫院的院墻之內,而且即便是在醫院內,不同科室之間的信息也難以相互聯通。信息無法共享,導致每個醫生、科研人員所能掌握的數據量非常有限。
②樣本量小成本巨大 受到信息割裂現狀的影響,腫瘤研究的樣本數量往往在百例左右。“據我們了解,單個醫生所做的研究,樣本數量往往在 100 個左右,多中心聯合的研究大概在 400 個左右。” 季春暉說,“但成本卻非常高,許多 400 例規模的多中心項目成本大概在 1000 萬左右。”
③數據結構化比例低 大規模數據分析的前提是數據的電子化,實際中,腫瘤患者個人的檢測數據量不僅巨大,而且基本是以紙質形式保存。“一名腫瘤患者病歷的結構化存儲,往往要花掉一個醫生兩天的時間。” 季春暉說,“即便在美國,也僅有 4%的患者數據被結構化了。”
正因如此,即便在美國,嘗試腫瘤大數據的創業公司也炙手可熱。就在今年1月 初,Flatiron 宣布完成有制藥巨頭羅氏領投的 1.75 億美元 C 輪融資。而在此前,這家公司分別于 2013年 完成 80 萬美元的 A 輪融資,和在 2014年 來自 GoogleVentures1.3 億美元的 B 輪融資。
Flatiron 做的就是應用大數據幫助腫瘤的精準治療。而他們計劃完成的一項重要工作,就是將全美腫瘤中心和其他醫療機構的腫瘤臨床數據進行系統化、機構化。和 Flatiron 類似,新嶼信息想在中國進行類似的探索和嘗試。
新嶼信息:以腫瘤科研為切口
新嶼信息的核心產品是 crabyter 科研寶,顧名思義,主要定位是為臨床腫瘤醫生或機構的臨床研究提供服務。
科研寶于 2010年 開始研發,于 2014年3月 正式上線,具備八項功能,包括課題管理、隨訪管理、統計分析、單一病人視圖、多源數據入口、數據質量管理、腫瘤知識庫、移動端輔助管理等,即將推行生物樣本庫管理、基因數據分析等功能。
科研寶的應用場景主要包括兩個:①醫生間的診療科研社區,如包括隨訪在內的患者管理,以大數據為基礎構建精準醫療模型;②企業等第三方機構提供的服務,如藥企、CRO 公司、基因公司為醫生科研提供的在線服務等。而如前所言,大數據分析的關鍵一步是實現數據的結構化。
“我們首先按照國際診療標準構建一個數據模型,然后通過引導模塊幫助醫生便捷地將數據填進去。” 季春暉介紹,科研寶提供的是一個在醫院原有信息系統之外的第三方應用工具,提供數據結構化、自動統計、專業分析等服務,醫生登陸后即可進行科研、患者管理等。
此外,科研寶平臺還支持醫生、科研機構多中心合作。研究發起后,科研寶提供多中心遠程管理、中心稽查,以及研究總結階段的系統 + 統計的綜合服務。
如季春暉所言,新嶼信息主要提供的是工具,并沒有主要挖掘醫院已有的患者數據的計劃。“如何拓展我們的用戶,關鍵切中醫生的需求。” 季春暉說,“腫瘤非常不同的是,超過 90%的患者分布在前 800 家醫院,尤其是大的三甲醫院。而這些醫院里的醫生對科研都有非常強的需求。”
集中度高有它的好處,但也是市場的目標用戶群體非常明確,也將意味著同類產品的競爭可能更激烈。“這類產品本身就非常復雜,對研發團隊要求很高。” 新嶼信息的研發團隊目前已有 50 多人,“而且數據沉淀量越大對用戶的粘性就會越高,尤其是多中心合作,用戶的轉換成本非常高。”
這其實也就意味著,同等級別產品的競爭,市場覆蓋速度將非常重要。目前,在全國范圍內,科研寶平臺上共有 4151 位臨床醫生,486 個腫瘤科室,399 個臨床課題,以及 20 萬例入組病例。“我們與中國臨床腫瘤協會、中國抗癌協會已經建立了深度合作,已有約一半的主任、副主任醫生加入了我們的平臺。”
2014、2015年,新嶼信息已經先后完成了天使輪和 A 輪融資。
“之前我們確定的覆蓋 200 家醫院的目標,有可能提前完成,所以現在也在考慮與投資機構接觸,進一步加快擴張。” 在談到 2016年 計劃時,季春暉說,“今年的計劃是繼續市場擴張,覆蓋更多的醫院,推動基因公司、CRO 公司、移動醫療公司合作,做強產品線,同時將我們增值服務的收費做得更加標準化。”