在目前的國(guó)內(nèi)互聯(lián)網(wǎng)行業(yè)內(nèi),跟風(fēng)之氣很重,如此“高大上”的大數(shù)據(jù)分析怎么能夠逃得過(guò)各類創(chuàng)業(yè)者,風(fēng)師和行業(yè)內(nèi)人士的法眼呢?因此無(wú)數(shù)的企業(yè)都開(kāi)始宣稱,我們要做大數(shù)據(jù)分析,大數(shù)據(jù)分析多么有用多么好,要是不做都不好意思和人打招呼。但是實(shí)際上,并不是所有企業(yè)和所有的商業(yè)模式都適合應(yīng)用大數(shù)據(jù)分析,在本文中,我們主要會(huì)針對(duì)大數(shù)據(jù)的成本問(wèn)題來(lái)進(jìn)行探討。
大數(shù)據(jù)理念決定的兩大問(wèn)題
大數(shù)據(jù)具有4V理念:volume、variety、velocity、value,前三者指數(shù)據(jù)的容量、類型和傳輸速度,后者指在前三者基礎(chǔ)上實(shí)現(xiàn)收集、存儲(chǔ)、管理、分析而產(chǎn)生的數(shù)據(jù)價(jià)值。如此問(wèn)題就來(lái)了,如何在前三者基礎(chǔ)上實(shí)現(xiàn)收集、存儲(chǔ)、管理、分析進(jìn)而使數(shù)據(jù)產(chǎn)生價(jià)值?如何在這個(gè)收集、存儲(chǔ)、管理、分析的過(guò)程中使其成本與所產(chǎn)生的價(jià)值成正比?
如果移動(dòng)醫(yī)療企業(yè)想要涉足大數(shù)據(jù),就必須解決下面兩個(gè)問(wèn)題:
第一,大數(shù)據(jù)項(xiàng)目需要耗費(fèi)多少成本;尤其對(duì)創(chuàng)業(yè)企業(yè)的運(yùn)營(yíng)過(guò)程中,控制成本是一個(gè)重點(diǎn)。
第二,如何進(jìn)行大數(shù)據(jù)的分析。因?yàn)槔么髷?shù)據(jù)的價(jià)值需要足夠的分析能力,需要知道其可能在移動(dòng)醫(yī)療的哪些方面發(fā)揮作用并創(chuàng)造價(jià)值。
技術(shù)成本過(guò)高
對(duì)于移動(dòng)醫(yī)療大數(shù)據(jù)而言,成本應(yīng)該包含兩個(gè)方面——技術(shù)成本和人力資源成本。這兩個(gè)成本分別蘊(yùn)含在大數(shù)據(jù)的存儲(chǔ)和分析中。但是數(shù)據(jù)分析能力的高低,才決定了大數(shù)據(jù)的真正價(jià)值??梢哉f(shuō),如果沒(méi)有數(shù)據(jù)分析,“大數(shù)據(jù)”只是一堆IT庫(kù)存,存儲(chǔ)成本極高而收益為負(fù)。
第一章中Dr.2曾經(jīng)說(shuō)過(guò),目前國(guó)內(nèi)大多數(shù)移動(dòng)醫(yī)療初創(chuàng)企業(yè),以所謂的大數(shù)據(jù)結(jié)尾,都是在耍流氓而已,因?yàn)槟壳八麄內(nèi)匀煌A粼趯?duì)大量數(shù)據(jù)的收集,整理,儲(chǔ)存和簡(jiǎn)單的分析等初級(jí)階段。能夠?qū)Υ髷?shù)據(jù)進(jìn)行進(jìn)一步研究、分析和運(yùn)用的企業(yè)少之又少,因?yàn)槌杀咎吡?想要從無(wú)數(shù)的垃圾中搜尋一塊金子,首先你需要一個(gè)巨大的垃圾存儲(chǔ)地,其次還需要耗費(fèi)很多人力物力來(lái)進(jìn)行搜尋工作,存儲(chǔ)和搜尋本身所耗費(fèi)的成本也許已經(jīng)超過(guò)了金子本身的價(jià)值。
大數(shù)據(jù)并非是一個(gè)簡(jiǎn)單的項(xiàng)目,首先就像很多IT項(xiàng)目中所包含的那樣,需要如下基礎(chǔ):軟件許可和支持、硬件資源、高通量的帶寬、存儲(chǔ)服務(wù)器、完善的組織架構(gòu)、人員專業(yè)技能和服務(wù)的培訓(xùn)、客服團(tuán)隊(duì)等。
不過(guò),大數(shù)據(jù)分析遠(yuǎn)遠(yuǎn)不止如此,很多IT項(xiàng)目在完成后,只需要保留少量人員后續(xù)跟進(jìn),或者安排機(jī)動(dòng)人員偶爾進(jìn)行維護(hù)即可,但是大數(shù)據(jù)分析卻是一個(gè)持續(xù)投入,不能間斷,越干越多的工作。因?yàn)槠浔举|(zhì)就是對(duì)數(shù)據(jù)進(jìn)行不停的收集,并進(jìn)行持續(xù)的分析,如果在某個(gè)時(shí)間段使用數(shù)據(jù)庫(kù)中的某一段來(lái)分析,那么它本質(zhì)上就只是小數(shù)據(jù)而已。所以真實(shí)大數(shù)據(jù)分析的支出和耗費(fèi)都將會(huì)是巨大的,移動(dòng)醫(yī)療的初創(chuàng)企業(yè)無(wú)法承受,那又何來(lái)商業(yè)模式呢?
人力資源成本也過(guò)高
從大數(shù)據(jù)的硬件支出管理方面來(lái)看,最初需要的存儲(chǔ)需求可能在能力范圍之內(nèi),但是隨著對(duì)數(shù)據(jù)速度要求的提高,那所需要的硬件需求可能會(huì)成百上千倍地增加。屆時(shí),你需要面對(duì)的是大量的硬件支出,以及額外的人員和技術(shù)資源用以管理整體環(huán)境。如果需要對(duì)數(shù)據(jù)流進(jìn)行實(shí)時(shí)分析,要檢測(cè)假象或有異常的地方,則需要其他的商業(yè)工具或數(shù)據(jù)可視化工具來(lái)幫助實(shí)現(xiàn)。這又是一筆巨大的成本支出。即使租用第三方服務(wù),如阿里云或亞馬遜云,其成本也相差無(wú)幾。
由于大數(shù)據(jù)分析的規(guī)模龐大,移動(dòng)醫(yī)療的小企業(yè)即使已經(jīng)砸鍋賣鐵開(kāi)始做了,后續(xù)的持續(xù)投入也會(huì)讓大部分人上西天,或者只能造假,人為干預(yù)!比如很多可穿戴公司宣稱的大數(shù)據(jù)商業(yè)模式,試圖收集并分析所有背有傳感器的患者的數(shù)據(jù),即使這些數(shù)據(jù)是由機(jī)器生成或者已經(jīng)保存在系統(tǒng)中,但由于這些數(shù)據(jù)類型、數(shù)量和增長(zhǎng)速率都各不相同,而且每個(gè)人的數(shù)據(jù)都需要長(zhǎng)期保存,按大數(shù)據(jù)分析的要求,即使是最為細(xì)節(jié)性的數(shù)據(jù)也不能隨意丟棄。因此隨著時(shí)間的積累,數(shù)據(jù)量就會(huì)越來(lái)越多,直到崩潰。
再者,數(shù)據(jù)庫(kù)如何保持穩(wěn)定和可擴(kuò)展性,如何不被黑客攻擊,如何保護(hù)數(shù)據(jù)來(lái)源(如患者)的隱私,這些都非三言兩語(yǔ)說(shuō)說(shuō)那么簡(jiǎn)單。
據(jù)麥肯錫咨詢公司公布的一份報(bào)告顯示,到2018年,美國(guó)在“深度分析人才”方面將面臨14萬(wàn)至19萬(wàn)的人才缺口;在“能夠分析數(shù)據(jù)幫助公司做出商業(yè)決策”方面將面臨150萬(wàn)的人才缺口。大數(shù)據(jù)分析職位相關(guān)的技能主要包括數(shù)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)分析、商業(yè)分析和自然語(yǔ)言處理。盡管對(duì)這些技能還沒(méi)有達(dá)成一致,但是數(shù)據(jù)科學(xué)家、數(shù)據(jù)架構(gòu)師等職位是大數(shù)據(jù)項(xiàng)目所必須具備的。
黎叔曾語(yǔ)重心長(zhǎng)地說(shuō)道:“二十一世紀(jì)什么最貴?人才!”所以對(duì)于移動(dòng)醫(yī)療行業(yè)的大數(shù)據(jù)項(xiàng)目而言,專業(yè)性的數(shù)據(jù)分析和數(shù)據(jù)挖掘人才,很難負(fù)擔(dān)的起如此高的人力資源成本。因?yàn)榇髷?shù)據(jù)的管理和分析對(duì)于參與者的收集、整理、統(tǒng)計(jì)、概率、數(shù)學(xué)、計(jì)算機(jī)、業(yè)務(wù)理解等方面的能力要求甚高。盡管“能力是可以培養(yǎng)的”,但是這些都不會(huì)從天上掉下來(lái)。而且移動(dòng)醫(yī)療行業(yè)與普通行業(yè)不同,既要具有深度的醫(yī)療行業(yè)背景,又要具備IT、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、管理法等的技能,這種人才真是非常難找啊!
簡(jiǎn)單把以上所述歸納如下表:
理念很好但落地很難
無(wú)論移動(dòng)醫(yī)療初創(chuàng)企業(yè)是想把大數(shù)據(jù)項(xiàng)目外包,還是想自力更生獨(dú)立自主來(lái)做,都需要考慮以上這些成本問(wèn)題,聽(tīng)起來(lái)似乎只有“三個(gè)字”,但實(shí)際操作就另當(dāng)別論了?,F(xiàn)在各位讀者知道Dr.2為什么說(shuō)一些人在耍流氓了吧,很多人真的只是在忽悠概念,連如何真正落地都沒(méi)有想過(guò)。

但故事并沒(méi)有完,為什么說(shuō)很多的移動(dòng)醫(yī)療大數(shù)據(jù)是偽命題呢?這是因?yàn)榇髷?shù)據(jù)經(jīng)常存在無(wú)意識(shí)的偷換概念、條件變異及本身存?zhèn)蔚那闆r。
在我們醫(yī)療行業(yè),兩個(gè)特征是很重要的——敏感性和特異性。敏感性是指患者的臨床表現(xiàn)方面,一般不會(huì)被遺漏。而特異性是指一種疾病所具有的特征,在臨床上,主要是被用來(lái)做診斷鑒別的,目的是用以排除易混淆疾病,是確診某種疾病的金標(biāo)準(zhǔn)。特異性是敏感性的充分必要條件,而敏感性只是特異性的充分條件而非必要條件。具有足夠的敏感性不一定就具有特異性,具有足夠的特異性也不一定就具有敏感性。
即使辛辛苦苦真的搜集來(lái)了數(shù)據(jù),可能卻是毫無(wú)用處,這就是因?yàn)獒t(yī)療中獨(dú)特的特異性與敏感性問(wèn)題、雜波干擾的問(wèn)題、一票否決的問(wèn)題和安全性第一的問(wèn)題,這些我們將在后面仔細(xì)討論。
{{item.content}}