奈特-特納(Nat Turner)和扎克-溫伯格(Zach Weinberg)
你以前可能也曾聽說過這樣的故事:兩個計算機神童在一所著名大學里相遇,對計算機的熱愛讓他們覺得志同道合,經過幾次熬夜編程之后,兩人創建了一個網站或者應用。很快,這個小小的副業就變成了一個創業項目,他們從投資者那里獲得了大筆資金,并創建了一家公司,兩人也在一夜之間搖身變成百萬富翁——至少是賬面上的百萬富翁。
乍看上去,奈特-特納(Nat Turner)和扎克-溫伯格(Zach Weinberg)的經歷似乎也和這個故事如出一轍。兩人在賓夕法尼亞大學新生入學的第一天相遇,很快就成了好朋友。如今年僅28歲的兩個人已經在紐約擁有自己的初創公司。但他們的夢想比大多數創業者的都更加宏大。兩人的初創公司不是大行其道的社交網絡、照片共享應用,或交友網站。他們也沒有為青少年提供在手機上談情說愛或者訂購夜宵的工具。
他們在兩年前創辦的公司Flatiron Health瞄準了醫療界的一個重大難題。特納和溫伯格希望能夠收集和分析堆積如山的臨床資料,以便在醫療界最復雜、最困難、最有賴于研究的領域中開辟一條道路,這個領域就是癌癥的治療——雖說兩人在沃頓商學院攻讀經濟學和創業專業,并沒有時間上太多的生物課。
但是,在你暗暗發笑之前,不妨先看看他們以往的經歷。Flatiron Health已經是兩人聯合創辦的第三家公司了。他們第一次創業是為大學生提供網上食品訂購服務,結果失敗了。在讀大三的時候,他們創辦了第二家公司Invite Media,希望利用大數據技術,讓數字營銷變得更加有效。這一次他們大獲成功,以至于谷歌——大數據計算領域的教父,也是世界上最大的數字廣告公司——在2010年以逾8000萬美元的價格收購了Invite Media。
“狂妄自大”
現在,谷歌已經再次向特納和溫伯格打開了支票簿——通過旗下的谷歌風險投資公司,向他們的第三家公司Flatiron Health投資了1億多美元(該公司總共融資1.38億美元)。但這兩位年輕的廣告技術專家,獲得的卻不僅僅是谷歌的青睞。
杜克大學醫學教授艾米-阿伯內西(Amy Abernethy)是一位著名的腫瘤學家,她雖然明知Flatiron Health要實現目標并不容易,但是該公司用徹底的、系統化的方式來收集和整理臨床數據的做法,卻給她留下了深刻印象,因此她決定今年7月加盟Flatiron Health,成為該公司的首席醫療官。
“我把自己的聲譽押注在了Flatiron Health上,”阿伯內西說。之前她一直在主持杜克大學的癌癥治療研究計劃,而且也曾參與過早期一些利用大量臨床數據來提高癌癥治療水平的“過分樂觀的”項目。
拋開這樣的認可(以及谷歌的資金)不談,這件事情的“狂妄自大”程度令人側目——兩個長著娃娃臉的科技業人士,希望給癌癥治療方式帶來重大影響,這可是大量科研人員和訓練有素的醫生尚未辦到的事情。對此,身為Flatiron Health首席執行官的特納既謙遜又無畏。 “我們正在建設一家高科技公司,只不過它恰好位于癌癥治療領域。”他說。
根據Flatiron Health的說法, 癌癥患者的治療數據目前只有一小部分獲得了系統化的收集;這些資料主要出現在隨機臨床試驗中,涵蓋了約4%的成年癌癥患者(雖然對這個數字的估計各有不同)。Flatiron Health認為,從余下的約96%的資料中收集和整理出更多信息,然后把它們反饋給醫生,可以幫助醫生制定出更好的癌癥治療方案。
從理論上講,醫生可以從中看到哪種治療方法對于有類似情況的大部分患者效果最好,而且,舉例來說,他們也可以把自己治療胃癌的狀況與全國各地其他專家的治療狀況進行比較,并迅速糾正一些問題。這些數據還可以讓他們了解到哪些治療方案有最好的成本效益,并且它們還有助于把更多患者和恰當的臨床試驗匹配起來,可能會加快新藥的開發和批準過程。
信念堅定
特納和溫伯格不是在宣傳高科技烏托邦,不是在說大數據可以根除癌癥的負擔,但是他們希望,這可以帶來有意義的成果。“我們只是在說,如果我們從其他行業學到了一個經驗,那就是數據具有價值,”特納說。“這個價值究竟有多大,我們還不知道。”即使成果很小,那也可能會影響數以百萬計的人。
“如果整體來說,我們能對癌癥產生5%的影響......”他沒有繼續說下去。2014年美國新診斷出的癌癥患者有將近170萬人,如果患者的生存率整體提高5%,相當于僅在今年就拯救了數以萬計的生命。
特納的父親是一名地球物理學家,在石油勘探行業工作。特納年少時在德州、路易斯安那州、荷蘭和蘇格蘭居住過。雖然淺棕色的頭發已經開始后褪,露出他寬闊的前額,但特納的面龐看上去仍像是個研究生。
成功的連續創業者往往相當招搖,成功的創新者也常常帶著一種自信可以改變世界的專橫,但特納既不招搖也不專橫。他和在曼哈頓上西城長大的溫伯格擁有一個共同的堅定信念:在挽救癌癥患者的生命方面,技術可以發揮重大作用。“當你對醫療領域和腫瘤學有所了解,你就會發現,一個謙虛精干的團隊,可以幫助解決那里存在的很多問題。”溫伯格說。
特納最初對癌癥產生興趣是在2009年,當時他和家人到北卡羅來納州度假的時候,他7歲的表弟布倫南-西姆金斯(Brennan Simkins)生了病,經過一系列測試,他被確診患有急性髓系白血病。接下來的一年中,這個孩子經歷了骨髓移植、復發、再移植,再復發。總之,西姆金斯不僅忍受了4次痛苦的骨髓移植,還經歷過一些誤診。不過2011年之后,西姆金斯的病情得到了緩解。
表弟這段令人痛苦的求生經歷,讓特納和溫伯格開始思考,他們可以做些什么來幫助其他有類似遭遇的人。他們考慮創辦一家新公司,最初的想法是通過互聯網提供治療的參考意見。兩人花了六個月時間來了解癌癥。他們在克里希納-耶斯萬特(Krishna Yeshwant,是名醫生,也是谷歌風險投資公司從事生命科學領域投資的合伙人)的不時陪伴下,走訪了60多家癌癥中心,與專家們交談,和醫生們一起查房,并和他們討論各種商業理念的可能性。
經過數十次這樣的交談后,特納和溫伯格產生了一個新想法。有大量臨床數據散落在全國各地腫瘤治療中心的備案系統中,他們想收集這些數據——通過數字和其他方式——然后整理它們,聚合它們,并把他們反饋給醫生,幫助醫生在如何治療患者方面做出更好的決定。
迎難而上
對于特納和溫伯格這樣的數據極客來說,臨床腫瘤學在數據方面的問題既明顯又熟悉。盡管醫療機構多年前就開始說服醫生和醫院接受電子病歷(簡稱EMR),但是要獲得和使用腫瘤數據仍然十分困難。
“EMR的數據太爛了,”特納說。同一個病人的數據可能分散在很多地方:內科、腫瘤科、放射科、外科、實驗室和病理報告處等等。即使進行了數字化,數據也往往采用的是非結構化格式。它會以不同的格式,出現在不同的實驗室報告和記錄中,而不是有條理地歸整在數據庫中。
更糟糕的是,仍然有大量數據隱藏在手寫和掃描的報告中,隱藏在沒人會去聽的音頻報告中,或者以低分辨率的PDF文件格式印在傳真紙上。此外,五花八門的不兼容的系統,以及嚴格的關于個人健康信息的隱私法規,更是讓數據在數以千計的腫瘤治療者之間共享變得難上加難。
從理論上講,電子病歷應該讓這樣的數據聚合和整合變得容易。但實際上沒有這么簡單,就拿癌癥患者經常要做白蛋白測試來說,同一家癌癥診所采用的同一種電子病歷中就存在30多個不同格式。乘上100多種不同的蛋白質和基因測試、切片,以及癌癥診療中使用的其他診斷方法——然后再乘以不同的電子病歷系統,不同的癌癥中心的數量——這下你知道有多復雜了吧。
Flatiron Health把這些信息綜合到一張表格中,方式是(a)對于不同的癌癥中心和實驗室,創建一個通用的數據模型,(b)通過匹配算法處理數據;對于這些數據使用的術語,該算法可以識別出其中90%,(c)使用一個數據處理引擎,實時轉碼術語,及(d)標出任何不匹配的術語,由醫生或護士進行人工識別。
一開始,特納和溫伯格花了兩年多時間來研發他們所說的數據模型,這個模型可以把海量臨床信息整理成有條理的類別。他們很快就意識到,同時對每種癌癥都采用這個方法太過復雜。因此,他們在一些醫生的幫助下,把側重點放在了結腸癌上。他們從已經發表的臨床試驗報告中提取一切信息,比如人口統計內容和居住地,癌癥的分期,對療法的反應等等,一共有350多個數據類別。然后他們在其他類型的癌癥上重復這個過程。
為了能自動從電子病歷提取數據,Flatiron Health采用的多種計算機技術,比如從實驗室報告中尋找數值的匹配算法。他們還微調了自然語言處理技術,讓計算機能夠“讀取”文件,并從中提取數據。由于這種系統非常容易出錯,所以Flatiron Health又開發了一個混合人機學習系統,以便捕捉和糾正錯誤。
公司還聘請了50名護士,手工輸入了500名患者的數據,從而獲得了特納所說的“訓練集”,它可以用來檢測自動收集的數據中的錯誤。然后把差異反饋給系統,以便完善這個自動收集過程。從理論上說,這是一個動態的系統,可以持續提高自身精度。
其他項目
Flatiron Health并不是擔負起這個使命的第一個組織。去年,非營利性專業協會“美國臨床腫瘤學會”(American Society of Clinical Oncology)推出了CancerLinQ,旨在開發一個挖掘臨床數據庫的系統,以便提高醫療質量,加快藥物的開發進程。
由資深計算機科學家馬蒂-鮑姆(Marty Tenenbaum)執掌的癌癥聯盟會(Cancer Commons)是一個非營利組織,它希望能進一步推進腫瘤領域臨床數據的標準化。而IBM也利用它的沃森人工智能系統,和紀念斯隆凱特琳癌癥醫院(Memorial Sloan Kettering)等癌癥中心合作,篩選數以百萬計的臨床資料、期刊文章內容,以及臨床試驗報告,以便自動為醫生提供治療方案的建議。此外,美國國家癌癥研究所(National Cancer Institute)還耗資5億美元,開展了一個名為“caBIG”的大型生物信息學項目。
早期的項目要么非常失敗,要么尚未取得積極成果。阿伯內西曾擔任CancerLinQ顧問委員會主席,還參與過其他用數字方式編輯臨床腫瘤學數據的項目,她說,Flatiron Health令她印象深刻的地方是專注于數據的復雜性。特納和溫伯格清醒地認識到,“試圖解決這個問題,只有技術是行不通的,”她說,“這就是為什么我決定與他們共事的原因。”
谷歌風險投資公司的投資不僅提升了Flatiron Health的聲望,而且讓它有了收購Altos Solutions公司的資金。Altos Solutions為腫瘤學領域提供電子病歷服務,其總部設在加州山景城,和谷歌相隔不遠。收購該公司給Flatiron Health帶來了更大的用戶群,也讓它進一步密切了與醫師之間的聯系。目前有210個癌癥中心正在使用Flatiron Health的系統,這些中心目前每年會接收30萬新患者。雖然其中大多數都是社區腫瘤診所,但也有一些大型學術機構。谷歌說,進行這項投資的部分原因,是為了加快這個前途光明的領域出成果的過程。 “如果不收購Altos Solutions,它可能還需要研發一代電子病歷,才能獲得廣泛使用,我們想避免這種情況發生,” 谷歌風險投資公司的負責人比爾-馬里斯(Bill Maris)說。“我希望能早日免除很多人的傷心和苦痛。”
在長島郊區工作的杰弗里-維西卡(Jeffrey Vacirca)醫生看好Flatiron Health的前景。他使用Altos 電子病歷系統已經有好幾年時間,它幫助維西卡改善了治療方案,但它的許多潛力仍未發揮出來。 “系統中有大量數據,但沒有人整理出來,也沒有人知道它們的價值,” 維西卡說,“我認為,這就是Flatiron Health工作的重要性所在。他們整理各種細節數據,整理數以百萬計的患者的治療結果,他們可以評估、分類,辨識出哪些做法真的有效。” 維西卡稱,Flatiron Health系統是“治療癌癥的基礎設施”。有了它,他就能了解自己采用的醫療方法是否在某些方面落后于其他療法。他還可以了解到,是否有更多的患者可以參加臨床試驗。“如果積攢病人的速度比以前快5倍,你可以想一想,藥品完成監管程序的速度可以快多少。”他說。
疑慮猶存
在談到長期的抗癌斗爭時,該領域的一些頂尖人士仍然對大數據承諾的前景持懷疑態度。前沿研究員羅伯特-溫伯格(Robert Weinberg)是麻省理工學院懷特黑德生物醫學研究所(Whitehead Institute for Biomedical Research)的創始成員之一,他最近在《Cell》雜志上發表文章,談到了大數據和癌癥之間起伏不定的關系。文章指出,從蛋白質之間的交叉影響到腫瘤突變,各種數據集的爆炸式增長,已經讓研究人員解釋它們的能力變得不堪重負。他還在一次采訪中表示, “有些人著迷于生物信息學,認為僅僅需要聚合數據,就可以獲得前所未有的、定性式的見解,我對這種看法不敢茍同。”
約翰-羅安迪斯(John Ioannidis)是斯坦福大學的醫藥保健研究和政策教授,他的看法也僅僅比羅伯特-溫伯格稍微樂觀一點。羅安迪斯認為,通過一個中央系統,把患者的基本資料和療法匹配起來,可以從整體上減少醫院在癌癥治療方法方面的大幅可變性,但是,在高度受控的臨床試驗之外進行的數據收集,可能無法帶來太多幫助。“如果沒有實驗設計,我們能從數據收集和整理中獲得多少東西?這是一個開放性的問題。”他說。
特納和扎克-溫伯格并沒有指望能讓懷疑者們很快轉變態度。但在Flatiron Health日益穩定的客戶群中,有很多人和他們一樣,都相信該公司的“智能數據”方法可以為癌癥患者提供更好的治療機會。阿伯內西說,除了其他裨益之外,Flatiron Health還可以開個頭,在社區診所和頂尖學術醫院之間架起一座橋梁,彌合它們之間的鴻溝,這往往會帶來很好的效果。
聯合創始人溫伯格也表示,Flatiron Health面對的是一場對抗癌癥的持久戰。 “我們的公司于兩年前創辦,擁有一個雄心勃勃的計劃。我們的起步相當不錯,但終究來說,這個問題本身很難對付,人們已經和它斗爭了數十年之久。”