作為時下最時髦的詞匯,“大數據技術”由于具有從各種各樣類型的數據中快速獲得有價值信息的能力而在越來越多的行業中被廣泛應用,對包括醫藥行業在內的眾多行業產生了顛覆性的影響。在近日召開的2015中國(北京)跨國技術轉移大會上,大數據成為會議關注的焦點內容。在“大數據藥物創新專題論壇”上,眾多業內專家從自身實踐角度,分享了對大數據的認識以及獨到的見解,強調了大數據對于新藥研發的重要性。
新藥研發需要大數據支撐
藥渡經緯信息科技(北京)有限公司執行總裁丁紅霞博士表示,隨著網絡和信息技術的不斷普及,人類產生的數據量正在呈指數級增長,而云計算的誕生,更是直接把我們送進了大數據時代。之前在醫藥領域,由于數據的采集及分析所存在的技術瓶頸,以及人們對這些數據意義認識的不足,使大數據的價值還未被真正挖掘。近年來,隨著醫藥數據積累的加速進行,醫藥領域的大數據迎來了從量變到質變的關鍵時刻,正在對生命科學、臨床醫療、藥物研發、醫藥營銷等領域產生革命性的重大影響。
丁紅霞介紹,創新藥物研發一直是所有醫藥企業面臨的難題。由于藥物的生物過程和藥物模型越來越復雜,藥物研發一直處于投入大而成功率低,以及產品線停滯的狀況。一個新藥研發的平均時間長達15年,平均耗費超過8億美元,其研發產業鏈包括了海量研發數據的搜尋、消化,涉及化學、生物學、毒理學、制劑學、專利學等各個學科的資源合作,以及與監管、審批部門的溝通,資本的投入及退出,產業化園區的選擇等等眾多環節。但是,目前藥物研發整體仍處于“各自為戰,單打獨斗”的狀態。雖然整個行業逐年投入大量的人力、物力,但眾多的重復性工作使其獲得的研發信息、研發資源配置效率低下,這種狀況有時甚至會對一個藥物研發項目造成致命的損害。
“大數據的應用是解決藥物研發周期長、成本高、不確定因素多等問題的重要技術支撐。”丁紅霞認為,通過使用大數據,研究人員可以從基因組學、蛋白質組學和代謝組學,協同臨床試驗數據和真實世界臨床數據進行挖掘,通過預測建模來幫助我們識別那些很有可能被成功開發為藥物的安全有效的潛力備選新分子,找出更有效的靶位、標記物、活性物質等進行驗證,以及在后續的動物實驗及臨床Ⅰ~Ⅲ期的臨床試驗數據中更加有效地進行篩選工作,從而縮短整個藥物研發的時間。
不僅如此,在制藥產業鏈眾多能產生數據統計的其他環節,大數據的使用同樣能發揮它的作用:幫助藥物監管、審批部門了解目前整個中國乃至世界的藥物研發現狀、審批情況、藥物使用情況等信息,以便在工作中更好地發揮自身職能;幫助市場資本更好地選擇項目的投入及適時退出;幫助生物技術公司更明智地選擇融資,進行產業化;幫助產業化園區挑選最有前景的項目落地,以及給予更有回報前景的支持。“在藥物研發整個板塊的各個環節提供大數據支撐,建立研發資源有效配置的平臺,對于整個醫藥產業將產生難以估量的影響。”丁紅霞強調。
用大數據配置優選研發資源
“2013年美國食品藥品管理局(FDA)批準了26個新分子實體(NMEs),2014年則批準了41個NMEs,逐年上升。2011~2014年,我國新藥的上市申請也平穩上升。”藥渡經緯信息科技(北京)有限公司創始人李靖博士在介紹了當前世界和我國新藥研發的總體形勢后強調:“新藥研發是一項復雜的系統工程,包括臨床前的靶點鑒定、藥物活性篩選、非臨床動物模型研究、臨床研究等,而數據的積累對于各個環節有著不可或缺的作用。目前,藥物研發工作對于數據服務的要求越來越緊迫。”
李靖表示,做藥物創新必須要進行文獻調研,需要研讀相關藥物的化學、生物學、毒性、臨床研究等資料,從而掌握相關信息。比如,每年有25~30個糖尿病治療新藥上市,每個新藥的文獻資料約兩萬多頁,那么要開發一個糖尿病治療新藥,需要把所有已上市新藥的相關信息都閱讀一遍,但這約有近100萬頁的閱讀量。“閱讀完這么大的文獻量確實可以成為專家,但也就沒有時間做創新了。這是有限的生命與研發之間的最大矛盾”。
李靖認為,對于藥物研發人員來說,將龐大的數據如2萬~3萬頁的文獻資料變成10頁,不僅可以很快地了解歷史,還能迅速應對將來的研發工作。對于藥物審評人員來說,通過數據及時了解已上市藥物的相關信息,提出的審評意見也會更加“靠譜”。“大數據提供的東西讓全世界的競爭者都站在同一起跑線上。”李靖說,藥渡的使命就是利用大數據技術,打造一個“綜合性,一站式的藥物研發信息服務平臺”,為個性化的藥物研發提供精煉的研發數據,配置優選的研發資源。
中康醫藥資訊(集團)有限公司的楊大洲則從進口藥物注冊的角度,展示了如何利用大數據把國外優質的藥物引進國內。對于進口藥物,傳統的途徑是國外熟人或中介推薦,但中間人推薦將使選擇范圍縮小,也許只能篩選某個國家、個別廠家的品種,這將大大降低匹配率,需要企業提供更加聚焦的篩選范圍。而由公司研發部或市場部人員從Google、各大公司網站等調研海量的藥物信息,費時費力。而利用中康的數據資源,可以根據銷售數據庫對產品的市場成長力進行篩選,根據藥品綜合信息庫進行初步信息確認,檢索國內注冊受理數據庫了解產品申報風險,檢索全球臨床試驗庫評估產品的學術地位,檢索全球已上市藥物數據庫篩選合適標的,從而幫助企業篩選出優質的國際合作項目。
應對大數據面臨的挑戰
湯森路透生命科學事業部中國區總經理胡大龍介紹,大數據具有規模性(Volume)、高速性(Velocity)、多樣性(Variety)、價值性(Value)的“4V”特性。在大數據時代,各機構都“被迫”更好地利用他們可獲得的數據,而面對大量數據的所有權,面臨的真正挑戰是對于數據的整合、分析與解讀能力。
“制藥行業對信息情報的解決方案就是整合。”胡大龍表示,藥物研發的關鍵信息有許多,包括:藥物化合物,合成路徑,化學反應,蛋白、基因序列,生物藥、化藥的基本信息,全球專利信息,財經信息,競爭情報,市場調研,多領域、多學科的研發文獻等,而通過信息整合技術(情報管理及可視化技術),可以讓這些信息產生高附加值的應用:如靶標的確定及認證、先導化合物的確認及優化、藥物研發途徑的選擇、高效的臨床研究、知識產權保護、跟蹤競爭者的活動、戰略策劃等。在整合的基礎上,還需要進行4種類型的數據分析解讀——規范性分析、描述性分析、預測性分析和診斷性分析。
胡大龍認為,數據無處不在。疾病的數據,包括疾病基礎醫學及市場數據、流行病學調研數據,以及診斷方法及信息、治療手段及方法、治療藥物研發及產品管線等數據;靶點機制的數據,包括最新的作用機制、靶點的發展、流行熱點靶點分布、靶點機制認證、相關藥物管線進展、藥物研發相關生物標記物等數據;化合物的數據,包括化合物的基礎科研,藥理、藥代、毒理,化合物的構效關系,全合成路徑,文獻及專利,動物實驗模型等數據;仿制藥的數據,包括原研藥的藥理、臨床數據,和化學合成、放大工藝等技術,配方技術開發,新劑型的研究數據,以及市場競爭產品分析、仿制藥競爭分析、專利到期日的分析數據等。制藥行業大數據整合、分析的應用,就是要在治療領域選擇戰略決策,進行靶點機制開發的風險評估、熱點品種的立項調研和仿制藥的立項篩選,以及控制合作交易風險和制定策略。
“由于大數據技術的介入,藥品研發的產業格局必將發生改變,有效地辨識其中的機遇與風險,將成為藥物研發企業成敗的關鍵。”胡大龍說。