你以前聽過這樣的故事:一對高才生在一所精英大學里相識,出于對計算機的熱愛而走到一起,在經過了幾次開到深夜的技術討論會后,創建了一家網站或是一種應用程序。沒等你聽說,他們的課余小項目就變成了新創企業,兩位青澀少年從投資者那里籌集到了大筆資金,入駐了高檔寫字樓,組建了一家讓他們一夜之間至少在賬面上成為百萬富翁的公司。
初看上去,納特 特納(Nat Turner)和扎克 溫伯格(Zach Weinberg)就是這樣的人。他們到賓夕法尼亞大學讀大一的第一天即成為密友。現在,這對年輕的二人組—都是28歲—在紐約經營著一家新創企業。可是他們的創業夢想比絕大多數人都要宏大。他們的嶄露頭角的新創企業不是普通的社交網絡、照片共享軟件或是約會網站。他們制作的工具不是給十幾歲和二十幾歲的人用來在手機屏幕上調情或是買夜宵的。
他們在兩年前創辦的公司Flatiron Health正在追逐一個相當大膽的目標:撼動醫療界。他們針對的,并非是一般的醫療難題。特納和溫伯格希望通過收集和分析海量的臨床數據,打入醫學界最為復雜、最需要研究、也是最艱難的一個領域:癌癥治療。不過,這二位在沃頓商學院(Wharton School)學的是經濟學和創業學,從來沒有上過一堂像樣的生物課。
不過,在你嘲笑他們之前,先想想這個吧:Flatiron不是他們一起創辦的第一家公司,而是第三家。他們嘗試過為大學生開辦一家在線食品購買服務網站,結果失敗了。他們的第二次創業是在讀大三時開辦的Invite Media,利用大數據技術來提高數字營銷的效力。他們獲得了巨大的成功,大數據教父、全球最大的數字營銷企業谷歌公司(Google)在2010年出資超過8,000萬美元,買下了Invite。
現在,谷歌為特納和溫伯格再次打開了支票薄,通過其風險資本部門谷歌風投公司(Google Ventures)給Flatiron注資超過1億美元。(Flatiron總共籌集了1.38億美元。)不只有谷歌被這兩位年輕的技術人員打動。杜克大學的一位醫學教授、著名的腫瘤學家艾米 阿伯內西(Amy Abernethy)承認,Flatiron的目標極難實現。但是,它的收集整理臨床數據的方法嚴密而周全,她深受吸引,在今年7月決定加盟公司,擔任首席醫學官。阿伯內西說:“上了Flatiron這條船,我已經把聲譽都搭上了。”她不久前主持過杜克大學癌癥研究計劃(Duke Cancer Care Research Program),曾經介入早期的一些通過收購大量臨床數據以改進癌癥治療的“夢幻”項目。
即使沒有背書以及谷歌的投資,這種極端自負的主張也值得關注:一對長著娃娃臉的IT技術人員居然將癌癥治療推進到迄今為止連科研人員和受過高度培訓的醫生都達不到的程度。Flatiron的首席執行官特納為人謙遜,卻無所畏懼。“我們在打造一家正好處于癌癥空間的科技公司。”他說。(他經常使用“空間”這個詞。)
Flatiron的論點如下:目前,僅有一小部分癌癥患者的治療數據得到了有系統的采集。這種采集基本上是在臨床試驗中隨意為之的,只覆蓋了大約4%的成人癌癥患者(不過,相關的估計有差異)。Flatiron將余下大約96%的信息加以整理,實現標準化,然后將數據提供給醫生。公司認為,這能幫助醫生找出更好的治療方案。
理論上,醫生們能夠找出病情類似的患者的最有效療法,或者是評估自己的療效,比如他們可以將自己的乳腺癌治療效果與美國各地其他專家的治療效果做比較,并且快速糾正不足之處。這些數據可以突顯出最為經濟的療法,反之也能展示哪里浪費了醫療開支。它能給更多的病人匹配合適的臨床試驗,有可能加快新藥開發和審批的過程。特納和溫伯格并沒有在鼓吹通過數據來終結癌癥困擾的烏托邦式的科技夢想,而是希望能夠帶來有意義的進步。特納表示:“我們所做的一切是在表明,如果我們能從其他行業中借鑒些什么,那就是數據的價值。有多大價值,現在還不知道。”即使好處不大,也能影響千百萬人。“哪怕只有影響到各種癌癥的5% ……”他說話的聲音漸漸變弱。2014年,美國有約170萬人新確診為癌癥,患者整體存活率提高5%,相當于一年就拯救了數萬人的生命。(參見圖表)
特納首次對癌癥產生興趣是在2009年。當時,他和親屬在北卡羅來納州度假,7歲的表弟布倫南 西姆金斯(Brennan Simkins)生病了。經過一連串的化驗,表弟被確診患上了急性骨髓細胞白血病,由此開始了多年的折磨,先是骨髓移植,然后又復發,再移值,再復發。西姆金斯總共經受了四次痛苦的骨髓移值,還被數次誤診。他今年12歲,病情自2011年以來一直處于緩解期。
表弟痛苦求生的經歷促使特納和溫伯格開始動腦筋,為患有類似病癥的人們做點什么。他們討論了開辦一家新公司的創意,起初考慮通過互聯網提供補充性的專業醫療建議。特納(他的橡膠手鐲上刻有西姆金斯的名字)說:“在半年的時間里,我們把精力都放在了癌癥上。”二人造訪了大約60家癌癥中心,與專家交談,和醫生巡訪,探討可能的商業創意。經常與他們同行的,還有克里施納 耶什萬特(Krishna Yeshwant),他是一名醫生和谷歌風投公司的合伙人,專業從事生命科學投資。
經過數十次交談,特納和溫伯格形成了一個新的創意:整理分散在美國各地的腫瘤治療中心檔案里的海量臨床數據,無論是數字形式還是其他材質的數據,加以編排匯總,再返回給醫生,目的是幫助他們更好地決定怎樣治療病人。
對于特納和溫伯格這兩位數據狂人來說,腫瘤學臨床數據的問題既明顯又熟悉。盡管多年來,醫學機構一直在努力說服醫生和醫院采用電子病歷(簡稱“EMR”),但是腫瘤學的數據依舊難于查找和使用。特納說:“EMR的數據太不合格。”一位病人的數據可能有幾十個來源:實習醫師、腫瘤科醫生、放射科醫生、外科醫生、化驗室和病理報告,等等。即使數字化的數據也存在著技術人員所說的“格式散亂”的問題。數據庫沒有經過規整,展示方式因化驗報告和病歷的不同而存在差異。更糟糕的是,隱藏的報告里的海量數據有的是手寫的,有的是掃描文件,有的是從沒有人聽過的錄音,還有的是由傳真機生成的低分辨率PDF文檔,結果造成各種數據系統無法兼容,再加上有關個人健康信息的嚴格隱私規定,令共享數萬種腫瘤療法變得難上加難。
坦白地說,挑戰極為巨大。
理論上,電子病歷應該很容易做這樣的數據匯總和整合。但是想想這樣的情況:假設要測量某一種蛋白質的水平,比如癌癥病人通常要化驗的白蛋白,來自于某家癌癥中心的EMR可能會被用30多種格式展示出來。這算是一大挑戰,考慮到癌癥治療中采用的蛋白質和遺傳化驗、活組織檢查及其他診斷方法超過100種,整理的難度將成倍增長。再考慮到美國獨立的EMR系統和癌癥中心的數量,難度又會提高很多倍。想必現在,你已經理解這個問題的復雜性了。
為了解決這一問題,特納和溫伯格花了兩年多的時間建立他們所謂的數據模型,也就是將海量數據清楚地分門別類的方法。他們很快發現,針對所有類型的癌癥來做這項工作實在是太復雜了。因此,他們與一群醫生顧問合作,專注于結腸癌。利用公開的臨床數據,他們提取了超過350個類別,包括人口結構、地點、癌癥發展期、疾病的生物學標識以及對療法的反饋,等等。然后,他們再對其他類型的癌癥重復這一過程。
從EMR中提取數據是一項極度勞動密集型的工作,為了將這一過程自動化,Flatiron采用了各種計算機技巧,包括給化驗報告確定價值的匹配算法。公司還完善了一種叫做“自然語言處理”的技術,讓計算機“閱讀”文件,并且從中提取數據。這類系統特別容易出錯,所以Flatiron創造了一種人機混合感知系統,鎖定并糾正錯誤。其實就是公司聘請了一個由50名護士組成的團隊,手工錄入500名患者的數據,制作出特納所謂的“培訓模板”,可以用來發現自動收集的數據中的錯誤。相關的差異再被反饋回系統中,幫助完善自動收集程序。
早期的努力——包括美國國家癌癥研究所(National Cancer Institute)的一項耗資5億美元之巨、名叫“caBIG”的生物信息學計劃—不是失敗,就是尚未產生積極的效果。但是,阿伯內西說,Flatiron對復雜數據的專注讓她驚嘆。她曾經擔任過CancerLinQ項目顧問委員會主席,并且參與了其他的臨床腫瘤數據的數字化編纂工作。她說,特納和溫伯格顯然明白,“光有技術解決不了這個問題,這是我決定和他們一起努力的原因”。
谷歌風投公司的投資不僅提升了Flatiron的信譽,還讓它有本錢收購為腫瘤醫學創造EMR服務的Altos Solutions公司。該公司位于加利福尼亞州山景城(Mountain View),距離谷歌不遠,收購它讓Flatiron擁有了更大的用戶基礎,加強了與醫生的聯系。目前,大約有210家癌癥醫療中心使用Flatiron的系統,每年共收治大約30萬名新患者。大多數客戶是社區癌癥診所,但是也有一些大型學術機構,比如耶魯紐黑文醫院(Yale-New Haven)的斯米洛癌癥診所(Smilow Cancer Hospital)、賓夕法尼亞大學(University of Pennsylvania)的艾布拉姆森癌癥中心(Abramson Cancer Center)。谷歌表示,給Flatiron投資的原因之一,是想讓一個前景光明的領域快點出成果。谷歌風投公司的主管比爾 馬里斯(Bill Maris)說:“我們努力不讓電子醫療紀錄還要再過一代人的時間才能得到廣泛應用。我希望,我們能省去人們的很多麻煩和痛苦。”
橫穿美國,前往位于長島(Long Island)林木蔥蘢的郊區杰斐遜港(Port Jefferson)的一座不起眼的低板辦公樓,這里的杰弗里 瓦奇爾卡(Jeffrey Vacirca)醫生相信Flatiron的愿景。瓦奇爾卡說,他已經使用了數年Altos的EMR系統,幫助他改進了對患者的治療,但是這個系統還有很大的潛力沒有發揮出來。他說:“數據非常多,但是沒有人能整理它,沒人知道其中的含義。我認為,Flatiron的重要性就在這里。它提取所有的詳細數據和數百萬名患者的治療結果,加以評估和歸類,尋找真正有效的方法。”瓦奇爾卡醫生將Flatiron系統稱為“癌癥治療的基礎設施”。他說,未來有了它,他就能發現,他對特定癌癥的治療方法是否在哪些方面已經落后并加以調整,還能確定是否有更多的病人符合臨床試驗的資格。他還說:“如果積累患者的速度增加五倍,想象一下,你能讓多少藥物通過規定的流程?”
該領域的一些領軍人物仍然對大數據的長期抗癌前景表示懷疑。在不久前發表在《細胞》雜志(Cell)上的一篇論文中,開創性研究者羅伯特 溫伯格(Robert Weinberg)指出了大數據和癌癥之間不穩定的關系。他與扎克 溫伯格沒有親戚關系,是麻省理工學院懷特黑德生物醫學研究所(MIT's Whitehead Institute for Biomedical Research)的創始人之一。他強調,從腫瘤里的蛋白質間的相互作用到基因突變,方方面面的數據膨脹已經超過了研究人員的解讀能力。他后來在一次采訪中對記者說:“有人對生物信息學太著迷,以為只要做一下數據匯總,就可以獲得從前無法得到的高質量的見解。對我來說,這一點并不明顯。”
羅伯特 溫伯格還說,即便可以利用數據來提高某些治療方案的療效,其改進的程度也并非大到足以讓醫生改變他們的療法。他說:“有很多大膽的嘗試和樂觀的聲明。相比于已經付出的努力,實際得到的經驗很少。”
斯坦福大學的一位醫學健康研究和政策教授約翰 約安尼季斯(John Ioannidis)給出的評價要高一些,但是也有限。他認為,如果有能力通過一個集中的系統將患者的病歷與療法進行匹配,有助于減少小診所與大醫院在癌癥治療方法上的巨大差異。但是除了高度受控的臨床試驗,依靠其他數據能否實現重大進步,約安尼季斯心存疑問。他說:“我們能從這個沒有試驗設計的數據大集合中學到多少東西,是個公開的疑問。”
特納和扎克 溫伯格并不期望能迅速打消別人的疑慮。但是他們和很多客戶(Flatiron的客戶數量還在不斷增長)都相信,他們的“智能數據”將給癌癥患者帶來更佳的治療。阿伯內西說,它首先可以消除社區診所和醫術通常更高的頂級教學醫院之間的差距。與此同時,聯合創始人溫伯格說,Flatiron從事的是長期抗癌斗爭:“我們是一家只有兩年歷史,但有著雄心勃勃的龐大計劃的新創企業。我們已經來了個開門紅,但歸根到底,這是一個需要花數十年才能解決的問題。”