也許是緣分,從學生時期到工作、再到創業,張新軍從來沒有離開過生物信息領域。
哈爾濱工業大學(哈工大)是國內最早設立生物信息專業的高等院校,這是張新軍夢想的發源地,從本科開始他就在這里生物信息學知識。后來他創業的團隊也幾乎來自這里,成員大部分是自己同校的師兄或者同學。
“大家背景比較相似,也比較了解。”他這樣告訴動脈網。
2009年碩士畢業后,張新軍又遠赴美國求學。這次他來到的是美國印第安納大學,研究課題是用機器學習算法去預測可能導致疾病的基因突變。用在腫瘤基因組的海量數據分析上,可以用來識別相關的驅動突變。這是現在Deep Diagnos算法模型的雛形。
2015年博士畢業后,張新軍進入了全球最領先的醫療器械公司之一——賽默飛世爾。這家公司測序儀的市場覆蓋率僅次于Illumina。他倒是進入的就是臨床科學部門,負責測序儀上的軟件設計。
“我當時的工作就是設計軟件來分析患者血液中的游離DNA,檢測出患者是否攜帶一些特定的突變,是否能夠尋找到合適的靶向藥物。”他回憶道。簡而言之,就是伴隨診斷的數據分析處理。
>>>>技術的追隨者
2014年開始,二代測序技術使得基因測序行業得到了極大的發展,液體活檢技術也在不斷的成熟,許多公司開始將這項技術用于腫瘤的檢測、輔助制定治療方案、甚至早期篩查。
“通過液體活檢技術,可以從血液里面檢測到非常微量的循環腫瘤DNA。但僅僅檢測DNA突變是做不到癌癥早篩的。”DeepDiagnos CSO胡楊博士表示。
胡楊是他在哈工大的校友,目前在哈佛大學從事博士后研究工作。胡楊在神經/免疫疾病和人類復雜疾病功能注釋及其相關研究領域共發表SCI 論文21 篇(其中第一作者或通訊作者論文15 篇),累計影響因子75。
胡楊與張新軍是我多年好友和同學,也是DeepDiagnos最早的成員。“2017年最開始有創業想法時,我就和胡楊討論過,之后決定一起創建團隊”張新軍回憶道。另外一位合伙人程亮同樣是哈工大的校友,2016 年 9 月被破格評為哈爾濱醫科大學生物信息學院副教授,2017 年被選為中國計算機學會生物信息學專業組委員。
胡楊認為,要實現癌癥早篩,必須要解決兩個問題:一個是判斷檢測到的突變是否意味著癌癥已經發生;另一個則是判斷癌癥發生的部位在哪里。液體活檢提供了無創檢測的先決條件,即數據產生的環節,但后續對數據的分析則需要依靠強有力的機器學習、深度學習的介入。
“癌癥最復雜的問題之一是如何識別驅動型突變,也就是直接導致癌癥發生的突變。依靠我們自主研發的AI算法,我們可以準確識別驅動突變,分析癌癥是否已經發生,甚至找到發生病變的位置。”張新軍補充說道,“這樣才算完成了整個篩查的過程。
2017年,DeepDiagnos團隊組建完成,正式開始了創業征程。Deep Diagnos的團隊成員均來自于哈佛醫學院、斯坦福大學,以及賽默飛世爾、阿斯利康等著名跨國企業。
國內國外團隊算起來差不多10個人,坦白說,目前公司團隊并不大,國外團隊主要負責技術研發、診斷模型設計,國內負責收樣和政府對接工作。
麻雀雖小五臟俱全。
>>>>高效篩選腫瘤標志物,用AI算法的力量挑戰腫瘤早篩
目前腫瘤早期篩查主要有兩個技術流派,一個是以Grail等公司為代表的甲基化測序路線;另一個則是以John Hopkins大學的CancerSeek為代表的基因突變結合蛋白標志物的路線。
兩個技術流派代表了不同的方向。甲基化路線是通過提取游離腫瘤DNA并進行甲基化測序,分析甲基化模式來判斷腫瘤的部位。甲基化的特點在于能夠很好的判斷腫瘤的組織來源。大家比較熟知的是甲基化在肝癌診斷中的應用,而對于其他癌癥,甲基化診斷的研究并不多。而且對于甲基化用于早期癌癥診斷的準確性,還沒有非常有說服力的研究數據。
DeepDiagnos采用的則是與CancerSeek類似的技術,這種技術的特點是操作流程相對簡單,算法模型的穩定性高,而且費用低。只需要檢測固定的一些突變位點和常規血清標志物,就可以實現準確的腫瘤篩查和并判斷組織來源。
deepDiagnos工作流程圖
張新軍向動脈網介紹說:“2018年4月Grail披露了一批研究數據,從中看來CancerSeek模型的預測效果并不亞于全基因組甲基化數據。而且由于Grail使用的是全基因組甲基化數據,成本至少是CancerSeek的十倍以上。但是CancerSeek也絕非完美,它目前對于I期腫瘤的診斷效果不好,但對于早篩來說一個非常不錯的開始。”
和CancerSeek最大的區別是,DeepDiagnos采用他們自己的AI算法來精準篩選驅動突變,而CancerSeek是靠“經驗主義”選取常見的驅動突變。AI算法的明顯優勢在于:如果某種癌癥的相關研究較少,僅靠經驗可能無法獲得足夠的突變位點,勢必會影響模型的準確性。而依靠傳統的研究方法去探索新的驅動突變,是一個非常艱難且漫長的過程。
DeepDiagnos自主研發的驅動突變篩選算法,可以快速的分析完一個患者的全基因組數據,并準確的找出其中的驅動突變。由于腫瘤患者的基因組差異性高,兩個患者攜帶同一組驅動突變的概率非常低,因此學術界熟知的那些驅動突變無法覆蓋所有的患者。只有依靠強大的AI算法才可以確保不漏掉任何一個有意義的突變位點。
利用自主研發的算法,實現高精度的全基因組篩查,發現癌癥相關的驅動基因突變
AI算法的優勢更體現在處理人種差異上。例如對于非小細胞肺癌,東亞患者的EGFR突變率顯著高于歐美患者人群。因此可以預見,如果只參考常見的驅動突變,可能會漏掉一些亞洲人群的特例。但是對于AI算法來說,就不存在這個問題。
胡楊介紹,他們的算法模型主要分為兩個部分。第一部是腫瘤的判斷,他們首先通過算法挑選出了一系列的突變基因列表,通過這些突變來判斷腫瘤發生的可能性。第二部分則是按照不同疾病分別來構建模型,將檢測到的數據放到模型里進行打分,然后將結果按得分的高低順序排列,分數最高的發生的可能性更高。
“這其實是一個量化的過程。”他這樣解釋。
>>>>數據獲取是最大困難
在過去一年里,團隊主要集中精力在攻克肺癌早篩。“這種癌癥發病率高,但是早期患者的預后很好,治療方案發展也比較快,所以早診比較有意義。”胡楊表示。
但算法模型的開發也并非易事,最大的困難就是高質量數據的獲取。機器學習模型構建好后,需要大量臨床數據用來訓練和測試,樣本量越多,所得出的結果也就越準確
“隨著收集的數據越來越多,模型的性能會越來越好,算法部分將是一個持續迭代的過程。”他表示,但收集高質量的數據這個過程本身就是困難的。
通過多年的數據積累,他們擁有了1000多例腫瘤基因組數據,覆蓋多種常見的癌癥
他們最先獲取到了部分半公開的數據。但明顯這些數據是不夠的,數據量級和多樣性并不夠。與哈醫大三院接觸多次后,他們終于與醫院達成協議,將臨床科研數據用于模型訓練。
“一開始一種癌癥可能只需要幾百例樣本,但隨著產品向市場推進,需要的樣本量會越來越多。”張新軍向動脈網解釋。體外診斷產品推向市場分為三個階段,第一階段叫做前瞻性研究,可能只需要幾百例樣本來驗證原理;第二階段則是多中心獨立試驗,需要的樣本量是上千例;這些試驗都是為了保證產品的可靠性,并為以后的上市審批做準備。
此外,DeepDiagnos還與另外兩家腫瘤醫院也達成并簽署了合作協議,通過這些醫院收集樣本進行前期的科研合作。
他向動脈網透露,目前肺癌早篩的panel已經開發完成,其中包含了多種肺癌相關的突變基因和蛋白標志物。在此基礎上,他們完成了一套算法模型開發,能夠分析計算受檢者是否已經發生了癌癥,并能夠量化癌癥發生的部位和階段。
“這個模型后續還可以擴展到泛癌癥。”他補充道。據了解,團隊目前已經開始了結直腸癌診斷模型的研發工作。
>>>>產品目標:降價,進入醫保體系
與專注于液態活檢的公司不同,DeepDiagnos給自己的定位是腫瘤I、II期的泛癌癥檢測。他們希望通過精準的預測,讓患者在腫瘤發生的早期階段就能夠有所意識、有所行動。
這也使得其產品擁有了多樣的產品形態。一方面,產品能夠像體檢項目一樣,承擔健康監測的職能。例如與保險公司合作,為高危人群提供每1到3年一次的篩查服務;另一方面,它也能夠像其他的體外診斷產品一樣,成為臨床腫瘤輔助診斷的工具。
“和保險結合肯定是要走的一條路。中國有幾億人口的煙民,其中肺癌的高危人群也可能達到一億。這對早篩來說是一個非常大的市場。”胡楊表示,“另外還有一些家族遺傳的突變基因攜帶者,所以體檢市場是非常可觀的。”
“我們最終的愿望還是希望產品能夠進入醫保體系。這也是大多數體外診斷(IVD)公司的愿望。”他補充道。
盡管相比MRI和PET-Scan檢測,基于液體活檢的早篩成本已經大幅降低,但這個成本離產品的大規模市場普及還有一定距離。
美國的醫療與商業保險結合非常密切,他們可以通過與保險公司合作,幫助保險公司去篩選一批高危的人群,為他們提供規律性的篩查,來減少未來的醫療費用開銷。對高危患者來講,保險公司的介入則能夠鼓勵更積極的篩查,降低患病風險的同時也為患者減少潛在的醫療費用支出。
“這對保險公司和用戶來說都好事,就好比美國牙醫保險都會提供每年兩次免費的洗牙,來降低未來患上嚴重口腔疾病的概率,為保險公司省錢。”張新軍表示。
“一開始可能會有些高端用戶,通過自己付費的方式進行檢測。但如果能夠進入醫保體系并隨著用戶人群的擴大,成本平攤效果越來越顯著,相信價格會變得十分親民,用戶群體將擴大很多。”他認為,如果最終給到用戶的客單價能夠控制在3000元人民幣內,將會有很大一部分高危人群會在每1-2年內進行一次檢測,每年受檢人群估計在五千萬到一億人次左右。
在進入醫保之前,他們會以臨床實驗室自建項目的方式進行銷售。接下來,肺癌的早篩產品將進入前瞻性臨床研究,并為臨床醫療器械資質申報做好準備。
>>>>下一步,人才和科研
目前公司正在準備肺癌早篩產品的臨床試驗工作,并在申請政府資金和政府項目。結直腸癌的產品模型也在研發過程中,后續產品也將緊跟肺癌產品進入市場。
接下來,人才擴展將是重心之一。“現在基本上把周圍的師兄師弟都騷擾了一邊。”張新軍調侃道,“這些人基本上都在哈佛、斯坦福等頂級院校從事科研工作,是目前公司需要的人才。”
另外一方面則是與國內外科研院校的對接,他們希望尋找到更多的美國和中國的科研院校進行合作,對更多的早篩產品進行進一步的開發和驗證,也為后續的臨床試驗奠定基礎。
據悉,公司已經完成了數百萬人民幣的種子輪融資,資金主要用于項目啟動和技術研發,目前有融資需求。