精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

移動醫療大數據的幾個偽命題

責任編輯:jacky

2014-07-24 09:01:02

摘自:199IT網

從這個角度來講,大數據非但沒有給我們帶來便利性,還可能會誤導、干擾我們的判斷,從而影響我們的決策。大數據的發展還不成熟,移動醫療的創業團隊在進行大數據項目之前一定要想清楚啊,千萬不要盲目跟風。

1

“大數據”是當下一個如火如荼的話題。大數據的確具有其整體性優勢——海量信息,全面而系統,其價值和作用有目共睹,不再贅述。

但事物總是“一分為二、對立統一”的,大數據因其規模“龐大”,數據散亂,雜波干擾嚴重,從信度和效度的專業層面來講,更是良莠不齊。尤其在這個霧里看花、真假難辨的年代,對各個行業的大數據分析我們更應該擦亮雙眼,謹慎擇之。而在移動醫療行業,Dr.2認為:關于本行業的許多大數據研究,很大一部分都是偽命題,大批以大數據分析結尾來論證其商業模式的企業,大部分都在耍流氓,他們不過是在欺騙投資人,欺騙員工,欺騙自己而已,甚至很多從業者以所謂的大數據分析,走上了欺騙客戶,小題大做,危言聳聽,虛言恫嚇的傳銷之路。

這是因為目前移動醫療大數據分析的規范性還不夠透明,其雜亂性會影響所有從業人員的判斷。面對如此多的數據,我們不禁要問:數據是怎么來的?從哪兒來的?有沒有收集數據的統一標準?為什么會收集這些數據?從實踐的觀點來看,一個好的移動醫療大數據項目應該具有實用性,而實用性主要體現在大數據的經濟性、便利性和可解釋性。

一、經濟性。

此處的經濟性從我們行業的實踐性來說,主要指其成本上的可操作性。因為移動醫療大數據的獲取成本特別高,如果你不是騙子去造假的話,所以各位同道不要盲目的輕信、宣傳大數據的商業價值,我絲毫不懷疑其巨大的前景,不過對小企業來說,沒有緩沖能力,搞好了固然很好,但是十有九不成,一賠就上西天,傷不起啊!

關于其成本與價值問題,Dr.2會在以后的連載中詳述,在此,我們主要關注移動大數據的目的性。我認為:如果以自己盈利作為唯一目的,那么他的大數據分析特別容易耍流氓。也就是說,如果收集數據的機構能夠通過修改、扭曲數據獲得經濟利益,那么這些數據就會因被扭曲而失真,那么我們要一堆經過人為修改、扭曲過的信息干什么呢?

舉個例子,比如某醫院委托某第三方公司做一份醫患關系滿意度的調查,此調查的目的是想要掛在醫院大廳或者刊登發表在媒體上給消費者看的,也就是為了做宣傳的,那么這份調查在一開始就具有了功利性。如此,該第三方公司用各種大數據研究的手段和方法去網絡調查,廣泛回訪,從社交媒體上搜索綜合分析,研究方法確實是真的,也可以持續跟蹤非常長的時間,去盡量搜集完整的數據(注意,普及一個概念,大數據不是指大量數據,而是指對事物研究的整體的,比較全部的數據而非抽樣分析調查來進行估算的數據)。

但是,這樣收集來的所謂的“患者數據”,其可信度就真的讓人不敢恭維了。推廣到我們行業中,多少調查之前就已經定了基調了?為了某藥,某血糖分析,某血壓監測的重大意義的大數據分析報告,諸如此類。

二、便利性。

移動醫療大數據給我們的生活、工作帶來便利性了嗎?如果正好相反的話,那么其作用將大打折扣,因為我們不是用它來創造工作量和麻煩的。比如,谷歌有一個名為“谷歌流感趨勢”的工具,它通過跟蹤網民的搜索詞等相關數據來判斷全美地區的流感情況(比如患者會搜索“流感”兩個字)。這個工具工作的原理大致是這樣的:設計人員置入了一些關鍵詞(比如溫度計、流感癥狀、肌肉疼痛、胸悶等),只要用戶輸入這些關鍵詞,系統就會展開跟蹤分析,創建地區流感圖表和流感地圖。

但是,現實要遠比理論復雜。谷歌搜索的結果和使用者人群“自我估計”的流感發病率相關,而當研究結果公布后,由于谷歌巨大的影響力,這使報告本身就對人們正常生活和行為有了影響,不但給生活帶來了一些不便,小題大做,而且很多人在搜索的時候還會受此影響,習慣性關注或者無意性關注,造成大數據“噪聲”影響大數據本身,最終導致大數據分析的不準確。

所以移動醫療大數據,它囊括了太多的偶然事件、小概率事件。比如一位家庭醫生給他的患者一臺電子血壓計,并囑咐其要每天測量并將數據記錄下來。而我們每一個人都是處在不同的環境氛圍中的。血壓肯定也會因情境而異。比如患者今天開了個生日party,昨天買彩票中了500萬大獎——人逢喜事精神爽啊,明天晚上加個班,后天看了一部悲劇電影,血壓肯定是會有變化的,因為這是人體自我調節機制在起作用。而這對于醫學上的動態監測沒有什么參考意義,還因為醫生不可能詳盡的知曉患者日常生活中的各種情況。這里的血壓升高被偷換了概念,而且條件也不成立。

從這個角度來講,大數據非但沒有給我們帶來便利性,還可能會誤導、干擾我們的判斷,從而影響我們的決策。企業領導者或者投資人是做什么的?他們做的不僅僅是事,最重要的是做決策。沒什么比一個半生不熟的大數據項目更讓人悲劇了。

三、可解釋性。

其實在敘述第二條便利性的時候已經涉及到了這一點。可解釋性,這一點很重要。因為面對大數據的使用者,或者面對我們普通大眾,它需要解釋很多問題。

(1)原始數據有沒有公布?若否,為什么不公布?

現在大部分人面對的所謂“大數據”基本上都是經過整合、分析、處理后的信息,而很少有人能接觸到真正的原始數據。任何缺少原始數據的研究結果很可能都是問題的。因為我們不清楚在這個信息整合處理的過程當中,信息都被做了哪些加工。這個過程相當不透明。就像水果經過加工成了果汁,我們無從知道這個水果在加工前是爛水果還是新鮮水果。同樣,我們所面對的現成的“大數據”的前身——“原始數據”,被加工前到底是不相關的垃圾數據還是相關的目標數據,我們一無所知。如果不公布原始數據,這就需要一個合理的解釋。

原始數據不公布很可能是因為以下的某一個原因:

1. 原始數據實際上沒有證明目標結論;

2. 原始數據會顯示出該研究使用了奇怪的定義或者有偏見的問題;

3. 原始數據可能根本不存在,因為研究結果很可能是某人或某機構有意圖的捏造。就像我前文中所說的醫院市調的例子,醫院想獲得對其有利的市調結果,那么這個結果很有可能就是人為干預的。

要求公布原始數據,并不是說我們一定會去對其進行研究分析,而是我們要知道原始數據是長什么樣的,是否是雜亂無章的,是否囊括了很多小概率事件的數據,是否具有相關性和因果性。

(2)是否偷換了正常的概念?

其實這一點有點像第二條中的“偷換概念”。還是醫院市調的例子,假如醫院所委托的市調公司將“醫患關系滿意度”定義為“疾病最終被治愈”,毋庸質疑,肯定會產生誤導。如果一份調查問卷中對于某個詞的定義超出了其普遍接受的含義,那么和這個詞相關的所有數據就基本上都是虛假的。

(3)被調查對象是否本身就沒有代表性?

去年央視有個很火的街頭采訪——“你幸福嗎?”假如你去問黨內人士,很難會得到否定答案,而且原因都大同小異,你懂的吧;假如去問一群小孩,你肯定會得到很多“五彩繽紛”的答案。去問問不同職業的人,去問問不同年齡的人……所以,如果一項調查只詢問那些肯定會提供特定答案的人,那么收集到的數據就會反應出此種特定的意志。目標人群不同,得到的結論肯定也不盡相同。大數據收集也是如此。

(4)結果是否計算了平均值?

在一個房間里有一名億萬富翁和九百九十九個身無分文的乞丐,他們的平均財富是一百萬美元。那么這個“一百萬美元”的平均數對那些乞丐來說是沒有任何意義的。如果用“平均”的概念來分析數據的話,那么我們所得到的結論可能會非常荒謬,因為在這些數據中存在著極大值和極小值,有關于極大值與極小值的概念我們在之后的連載中會為大家詳細論述。

有效的數據應該使用“中位數”,中位數是指將統計總體當中的各個變量值按大小順序排列起來,形成一個數列,處于變量數列中間位置的變量值就稱為中位數。在上面那個例子中,財富的中位數是零。

(5)是否先入為主地假定了因果關系?

在大數據中會經常出現一種情況,有兩個因素,在數據互相比較的時候,看起來會有些關系,但是其實并不是互為因果。即使兩組數據看起來節奏一致,你也不知道這種一致性是否一定有意義,除非你很肯定地知道一組數據的因會導致另一組數據的果。所以相關性并不一定是因果關系,也有可能是因為第三因素的影響。所謂的相關性,往往是要通過相關精確的數值來驗證的。

1. 有些相關是機緣巧合產生。能證明存在,但是不能證明是必然相關的。

2. 數據之間的聯合變動,表示兩者確實是有關聯,但是無法確定何者為因,何者為果。

有的時候所有變量相互之間,本身是沒有影響的,但是我們實際計算下來會發現他們有顯著的相關性。或者換個角度說,還有一種情況就是數據都是真實的,但是不真實的是根據這些數據推測出的未經證實的結論。

舉個比較極端的例子,我家門口樹上有個鳥巢,我經過N多年的觀察發現,國家財政赤字的時候,樹上的鳥比較多,而財政有盈余的年份,樹上的鳥比較少,或者這個地區的升學率和千里之外另外一個地區的蘋果產量經大數據分析,存在某種關聯一樣,這是否把“蝴蝶效應”無限放大了?這就是牛頭跟馬嘴互相類比和關聯。

搜集這樣的資料,卻把它說成是那樣一回事,一般的做法是將看上去極像,而完全不同的兩件事混淆在一起。所以,即使大數據分析得出有99%的可能性是這樣那樣的原因,那又怎樣?想要用數據說明問題,要看逆否命題是否站的住腳。

基于以上分析,大數據是否真實可靠,是否如業界所說具有高價值高回報率,是否應該大范圍的用來輔助我們的決策,這些問題都仍值得商榷。大數據的發展還不成熟,移動醫療的創業團隊在進行大數據項目之前一定要想清楚啊,千萬不要盲目跟風。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 来宾市| 安乡县| 甘洛县| 土默特右旗| 始兴县| 乐都县| 灵石县| 忻州市| 丽水市| 吕梁市| 合水县| 莱州市| 金昌市| 哈尔滨市| 都兰县| 周宁县| 开远市| 广饶县| 疏附县| 武陟县| 富宁县| 麟游县| 仁布县| 纳雍县| 玉树县| 突泉县| 公主岭市| 铜山县| 大厂| 洱源县| 邵武市| 镇坪县| 高青县| 宁陕县| 克什克腾旗| 遂川县| 河池市| 犍为县| 邛崃市| 大足县| 封开县|