2015年7月21日,《美國新聞與世界報道》公布了美國2015-2016年最佳醫院排名。緊隨其后的7月22日,由中國醫學科學院、中國研究型醫院學會主辦的現代化醫院評價與評估高峰論壇舉行,國家衛計委醫療管理服務指導中心主任趙明鋼指出,中國將基于數據,科學、規范和準確地建立全國醫療機構的統一評價體系。
其實,《美國新聞與世界報道》對全美醫院的評價排名已進行了十余年,類似的評價體系在美國還有很多,例如:消費者報告(Consumer Report)、醫院安全指數(hospital safety score)等。與美國已經相對健全的醫院評價體系相比,中國在此領域才剛剛起步。
本文將簡單梳理中美在醫院評價體系上的異同,并希望從中獲得對大數據時代中國醫院評價體系發展的啟示。
數據至上
數據是醫院評價的靈魂。如果去問一個美國醫院評價者最重要的是什么,答案一定是數據。《小王子》中說:真正重要的往往是無法通過雙眼直接看到的(L'essentielest invisible pour les yeux)。雖然醫院的硬件條件可以反映一定的事實,但是更重要的信息往往埋藏在海量的醫院運營與病歷數據中。
在美國,聯邦政府的CMS部門構建和維護龐大的數據庫,用于跟蹤每一筆醫療保險報銷并監控其背后的醫療行為。美國醫院協會和一些專業醫療機構也擁有大規模、跨地域的病歷數據庫。而這些客觀的數據庫就成為第三方評價的最主要信息來源。當然,這些數據庫往往記載的是較為表層、未經處理(或經過簡單處理)的原始醫療數據。第三方的評價功力,就體現在如何利用這些數據合理、客觀地進行醫院排名。
其中有一些指標較易取得或計算,如某些重點疾病的30天死亡率,顯然與醫院醫療質量和安全有著密切的關系。但有些指標,如住院期間發生的感染,手術之后出現的并發癥等信息,則可能深深埋藏在數據(例如病程記錄)之中,而這些信息對于真正關心醫療安全和質量的患者,以及真正希望醫院管理能夠精細化的管理者,有著極高的價值。
近年來,隨著美國醫院數據的全面電子化,數據量已經不再是問題的關鍵(相信中國在自上而下的醫療改革過程中很快也會如此),而數據挖掘的相關技術,才是醫院評價的關鍵所在。試想,當面對上千萬份電子病歷,其中一大部分卻都是運用醫生式的語言來描述患者病情,那又如何能完整地呈現患者的就醫經歷,是否存在院內感染,檢查是否恰當而不過度,疾病是否好轉或治愈,以及出院后特定時間內是否再次入院?
在中國,雖然HIS和電子病歷已在大醫院中普及,但即使排除行政層面的重重限制,現階段可供整合的數據仍十分有限。多數醫院還是愿意使用傳統的方法統計簡單、表層運營數據,且僅局限于內部使用。
今年6月27日,國家衛計委醫療管理服務指導中心相關負責人透露,中國將建立一個基于國家醫療數據中心的醫院綜合評價體系。該體系包括基于病種對比的醫療服務能力分析和基于DRGs的醫療服務績效分析兩大部分,將充分運用大數據理念,依托國家醫療數據中心。
在具體操作中,醫管中心將病案首頁的第一診斷和疾病疑難危重的分級指數來作為分級,同級別病種比對包括時間消耗指數(平均住院日)、費用消耗指數(均次住院費用、費用結構)、醫療服務質量(住院死亡率),并將這三項內容綜合比對醫師醫療服務能力水平;而不同級別病種數量比對體現的是則是專科醫療服務能力水平,即大型醫院的疑難病種到底有多少。
翟曉輝承認,做到上述這一切的前提是對國家醫療數據中心實行網格化管理,各成員單位及時準確地上報醫療數據。
雖然在規模與評價方式上還有較大的差距。筆者認為,隨著對醫院評價關注熱度的不斷提高,國內在規模上超越美國只是時間問題。然而,在優化評價方式方面,中國的路還很漫長。
下一步我們亟需考慮的是如何充分挖掘并整合大數據,將其納入醫院評價體系。使真正跟醫療質量相關的變量(如住院的感染、并發癥、可以避免的二次住院),代替如今主宰評價體系的表層變量(住院時長等),真正用于醫院質控。
醫療大數據的應用
下面將用幾個當今大數據在醫院評價領域的應用展示數據挖掘的重要意義。需要指出的是,這些應用只能展現大數據在醫療領域貢獻的的冰山一角。還有無限的寶藏等待高手挖掘。
1.患者安全評價
一所醫院的產出很大程度上取決于患者是否能夠安全地在醫院接受救治。所謂安全,可以表現在幾個方面:首先,導致患者入院的疾病能夠有效地被控制甚至治愈;其次,病人留院期間,不會因為醫院的環境或治療方式產生其他不必要的癥狀(如感染,術后并發癥等)。但還沒有明確的指標準確反應此類事件,所以需要我們使用適當的技術從海量的病人數據中發現此類現象。
通過對電子醫療數據的系統分析,數據提取與統計分析,我們可以知道一所醫院是否經常導致某類病人的不必要感染。如果屬實,是否是由于醫院運營或某些醫療過程的操作不當導致。在美國,某所醫院患者感染率居高不下,專家通過分析其原因得出病房格局設計不合理導致交叉感染的結論。
美國新聞與世界報道最佳醫院排行自2013-2014年最佳醫院排名中使用了6個患者安全性指標(PSI)。根據RTI的數據分析后增加了兩個額外安全性指標,它們是AHRQ PSI 03和AHRQ PSI 08,分別代表了皮膚破裂(褥瘡性潰瘍)的發生率和術后髖部骨折的發生率。這將更加全面地反映醫院的安全性。
2. 醫院質控
醫療改革領域中的臨床轉型實際上就是在品質提升、風險管理、績效考核和成本控制幾者之間保持微妙的平衡。一旦將大數據技術應用于醫院,我們便可以從一個新的高度分析醫院的運營情況。目前英國NICE(國家衛生與臨床技術優化研究所)、德國IQWIG(質量和效率醫療保健研究所)、加拿大普通藥品檢查機構等都開展了類似項目并且取得了初步成功。
談到排名,也許很多醫院都敬而遠之,擔心一旦名次較低會影響醫院長期發展。然而,沒有評價與競爭就無所謂優化與長遠的發展。在和其他醫院的比較中院方往往可以發現自身的不足。如果醫院再入院率(readmission rate)居高不下,我們就需要反省,對某些病人的出院決定是否太草率了,又或許是病人出院后的用藥指導不夠明確。而無論如何,一旦能夠發現問題并嘗試解決,醫院的發展只會蒸蒸日上。而數據的共享,無論對醫院的科研還是運營,均有著戰略性價值。
3. 患者尋醫指導
不幸罹患疾病,病人總是想得到最好的醫療服務,這也導致了有些專家號被炒至幾百甚至上千元。從全局考慮,如何讓病人在合適的醫院看合適的病是極為重要的。所謂合適,是指既不小題大做、浪費金錢及醫療資源,也不讓大病患者無處就醫、四處轉院浪費寶貴的救治時間。面對這一難題,數據也許能給出讓人滿意的解決方案。
如果有一個如同美國HealthGrade或者Consumer Report一樣具有公信力的第三方、綜合性評價平臺,通過對各地醫院的現有病歷的綜合分析,患者就可以知道哪些醫院有收治某類患者的資質以及治療對應疾病平均的開支、安全情況等。綜合比較后,病人便可以選擇最合適的醫院解決自身問題,避免疾病亂投醫現象。同時,醫院通過該數據也可以了解自身的優劣勢,以便有針對性地進行改進。
評價體系三要素
考察任何一個評價體系,無非考慮三個因素:1. 評價機構(誰在評),2. 評價方式(如何評),3.社會影響(誰在看)。
現階段,國內主要實行自上而下搭建醫院評價體系,如國內應用最普遍的醫院等級劃分標準(三級十等)。最初醫院評審分等標準包括醫院的規模、技術水平、醫療設備、管理水平、醫院質量等五個標準,但由于其他評審內容設置缺乏直觀指標,如今容易量化的硬件標準(床位、科室設置、醫療設備、人員配備等)成為劃分醫院等級的決定因素,暫時未能考慮醫院的綜合醫療效果。
醫院著重加強基礎設施建設以期在短時間內達到突擊效果,醫療質量和安全評價則未受到重視。嚴格來說,這并不是全面的醫院排名。
而美國則流行官方集中數據,由第三方公司或組織進行多方位、多元化評價,更關注醫療產出以及患者滿意度。近年來,國內也有一些非政府機構嘗試進行國內醫院排名。例如由復旦大學醫院管理研究所組織、全國30個臨床專科的幾千位著名專家學者共同參與評審的"中國最佳醫院排行榜"。
上述版本的醫院排行榜分為專科聲譽和科研學術兩個部分。其中,醫院專科聲譽主要由專家提名心目中名列前茅的醫院,而在科研學術方面,得分主要來自于國家級獎項和SCI影響因子(美國學術界極少使用SCI雜志作為判別標準,但筆者認為,影響因子較論文數量是個更為重要的指標,此處沒有使用SCI論文數量是個較大的進步)。
與中國官方的醫院評級系統不同的是,美國官方對醫院更多只做分類(床位多少,所有權等)而不做評級。對醫院的評價由各個營利性公司或非營利機構來做,有別于國內對硬件配置的重視,美國醫院把提高醫療質量及患者滿意度作為最終目標。
現今美國主流醫院評價平臺包括:消費者報告(Consumer Report),Healthgrade,hospital advisory board,醫院安全指數 hospital safety score,Joint Commission,美國新聞與世界報道(US News &Report)等。其中多數都是涵蓋了上千家醫院的大規模評價體系,按年更新甚至按季度更新,具有相對成熟的用戶搜索界面和極大的用戶訪問量。以《美國新聞與世界報道》的醫院排名為例,覆蓋美國近5000家醫院,調查14萬左右的醫師,為16個醫療領域的137家醫院排名。該排名對醫院聲譽、患者存活率、患者安全性及其他醫療相關指標在內的數十項評價指標進行綜合排序。
國內的評價體系正在向美國看齊。
對于最后一個問題:排行榜是給誰看的?美國的評分者認為理所當然地是給患者看!醫院排名的宗旨就是讓患者選擇合適的醫院、醫師。這也是為什么第三方選取的眾多評價標準中多數是關于患者安全、醫療質量及就醫滿意度的,而這些指標正是一個排行榜見功力、需要大量數據分析支撐的地方。
中國的排名處在萌芽期,技術水平不成熟,只選擇了專科聲譽和學術文章這兩個指標,雖然前者主觀性較強,受固有觀念和歷史影響,有一定滯后性,缺乏詳細量化標準,后者和臨床服務質量也并不完全呈正相關,但至少作為一次有益的嘗試,對醫院管理、國家政策制定均有輔助作用,對患者尋醫就診也有指導意義。