控制新冠肺炎疫情的傳播是一場持久戰(zhàn)。目前,多家大數(shù)據(jù)公司和科研部門正在加緊運用大數(shù)據(jù)支撐疫情防控服務,“大數(shù)據(jù)+流行病學”的廣泛應用,也許會給這次的疫情防控以及未來的公共衛(wèi)生防疫體系建設,提供一條重要的道路。
新冠肺炎疫情的發(fā)展牽動著每個個體、每個家庭的心,也影響著各行各業(yè)的生存與命運。隨著疫情每日確診數(shù)據(jù)和疑似數(shù)據(jù)、死亡病例和治愈病例的波動,我們的心情也隨之起伏,因為這每個數(shù)字背后,都是高密度的生命悲歡與哀樂。
而除了這些肉眼可見的數(shù)據(jù)之外,又有哪些居于暗處的、微觀細小的、甚至毫不起眼的數(shù)據(jù)是我們所應該關注的?哪些數(shù)據(jù)又將會在這場疫情防控中幫助我們突出重圍?并為我們以后的公共生活與個人生活提供反思?
與2003年SARS時期相比,彼時尚未廣泛應用的大數(shù)據(jù)正在這次疫情中發(fā)揮重要作用。在互聯(lián)網(wǎng)成為主要信息平臺的當下,搜索引擎、社交網(wǎng)絡、社交媒體、APP客戶端等海量信息的流動,得以幫助人們實時獲取疫情動態(tài),知曉和關切疫區(qū)人民的安危;而在數(shù)據(jù)、科學與技術的合力下,科學家們也可以通過對互聯(lián)網(wǎng)數(shù)據(jù)和手機數(shù)據(jù)等信息的搜集和分析,有針對性地預測疫情趨勢,防控疫情。目前,多家大數(shù)據(jù)公司和科研部門正在加緊運用大數(shù)據(jù)支撐疫情防控服務,“大數(shù)據(jù)+流行病學”的廣泛應用,也許會給這次的疫情防控以及未來的公共衛(wèi)生防疫體系建設,提供一條重要的道路。
當然,在任何情況下,大數(shù)據(jù)都是一種資源,也是一種工具。它告知信息但不解釋信息,它指導人們?nèi)ダ斫?,但有時也會引起誤解,這取決于它是否被正確使用。
關于此次大數(shù)據(jù)在新冠肺炎疫情防控上的應用,我們采訪了電子科技大學教授、大數(shù)據(jù)研究中心主任周濤。他認為,控制新冠病毒的傳播是一場持久戰(zhàn),而非一場殲滅戰(zhàn),社會經(jīng)濟生活不能因為這場疫戰(zhàn)而中斷,而復工復學又會帶來人口跨省區(qū)的流動和大量人員聚集,為病毒的傳播創(chuàng)造條件,非??赡芤滦乱惠喌膫魅靖叻?。因此周濤目前正在全力進行疫情數(shù)據(jù)分析,密切關注疫情動態(tài)。
周濤,電子科技大學教授,大數(shù)據(jù)研究中心主任,主要從事統(tǒng)計物理與復雜性方面的研究。著有《為數(shù)據(jù)而生》、《重塑:信息經(jīng)濟的結構》(合著),譯有《大數(shù)據(jù)時代》、《巴拉巴西成功定律》等數(shù)據(jù)科學行業(yè)書籍。
專訪周濤
采寫 | 楊司奇
輕中度患者數(shù)量
昭示了新冠肺炎疫情的致病嚴重程度
新京報:在這次新冠肺炎疫情中,大數(shù)據(jù)在不少領域發(fā)揮了重要作用,比如人群流動分析、疫情評估和預測等。你主要關注的是哪些方面?根據(jù)你的了解,目前大數(shù)據(jù)在防疫應用中有哪些值得借鑒的案例?
周濤:根據(jù)當前疫情的發(fā)展狀況,我目前主要關心兩個方面的問題。一是估算新型冠狀病毒傳播初期的關鍵參數(shù),從而為挖掘病毒的傳播規(guī)律和趨勢奠定基礎;二是在2月10日之后,我們即將面對學生、農(nóng)民工、上班族等人口流動需求的壓力,屆時我們將通過對包括人口遷移數(shù)據(jù)、社交媒體數(shù)據(jù)、傳播初期的微觀病例數(shù)據(jù)和病人移動軌跡數(shù)據(jù)來定量分析人口遷移對疫情傳播的影響。
大數(shù)據(jù)在防疫應用中有很多經(jīng)典案例值得借鑒,例如眾所周知的2009年甲型H1N1流感,谷歌根據(jù)檢索的詞條大數(shù)據(jù),構建起詞條使用頻率與流感在時間和空間上的傳播關系,從而成功的對冬季流感的傳播做出了準確預測。
新京報:目前,我們對疫情的關注重點大多在確診病例、疑似病例、重癥率、病死率和治愈率等指標上,但你和幾位學者指出,除了這些,還應當關注醫(yī)院收治的輕度、中度患者數(shù)量的絕對值和相對值,這些數(shù)據(jù)對于疫情防控和預測有什么關鍵意義?在這次疫情中,有哪些容易被忽視的重要數(shù)據(jù)?
周濤:在傳染病的防控過程中,阻斷傳播尤其重要,而輕度和普通程度患者的數(shù)量暗示了新冠肺炎的致病嚴重程度,致病嚴重程度則會影響感染者就醫(yī)的時間和比例。即如果感染者并未被引起嚴重疾病,未出現(xiàn)癥狀或只出現(xiàn)輕微癥,他們很可能不會重視并就醫(yī),通過日?;顒泳蜁⒉《緜鞑ソo更多的人。在醫(yī)療資源和其他公共資源有限的情況下,特別是隨著正常社會經(jīng)濟生活的展開,我們很難對其進行有效的隔離,對傳播控制造成極大的困難。
此外,疑似病例轉化為確診病例的比例也很重要,現(xiàn)在也是流感高發(fā)期,我們需要判斷出大概有多少出現(xiàn)癥狀的人是病毒感染者,這可以讓我們能提前做好醫(yī)療資源分配,不至于出現(xiàn)院內(nèi)傳播和未被有效隔離的現(xiàn)象。目前有些地方檢測、隔離和治療資源都比較有限,我們目前還正在計劃通過對發(fā)熱門診病人的數(shù)據(jù)進行深度分析,計算不同年齡、性別、活動區(qū)域、接觸記錄和癥狀表現(xiàn)的人被確診和發(fā)展為重癥的概率,從而為有限資源的優(yōu)化配置提供借鑒。
丁香園·丁香醫(yī)生每日實時更新的新冠肺炎疫情地圖
新京報:在疫情發(fā)展的不同階段,大數(shù)據(jù)分析應該都會面臨不同的任務和困難。在當前階段,你覺得大數(shù)據(jù)工作者最應該在哪些方面發(fā)力?
周濤:大數(shù)據(jù)分析目前主要是在阻斷傳播的措施建議和政策效果評估上起到主要作用:
?。?)通過大數(shù)據(jù)分析病毒的基本再生數(shù)和有效再生數(shù)等,我們可以量化病毒的傳播能力,對于應采取的措施手段有細化的建議,能有效及時地阻斷傳播;
?。?) 通過信息化手段對防疫相關的醫(yī)療資源和其他公共資源進行一體化的管理和調(diào)度,在政策落實的高效化上發(fā)揮一定的作用;
(3)對當前病例情況的分析,可以使我們明確前期的政策是否起到了效果,起到了多大效果,并在不完善的方面進行建議和修正;
?。?)可以利用大數(shù)據(jù)挖掘防控策略應該針對的精準地點、精準人群和精準行為,就是說什么人在什么地方做什么事兒是最容易被感染的。
新京報:根據(jù)你的了解,2003年非典時期是否已經(jīng)出現(xiàn)大數(shù)據(jù)應用的經(jīng)驗和范例?這次的疫情與非典時期相比,在數(shù)據(jù)分析水平和環(huán)境上有哪些進步?還有哪些待完善的地方?
周濤:在SARS期間,美國已有自己的全國公共衛(wèi)生系統(tǒng),包括國家應急行動中心、電子網(wǎng)絡疾病監(jiān)測報告系統(tǒng)、大都市癥狀監(jiān)測系統(tǒng)以及臨床公共衛(wèi)生溝通系統(tǒng)。這些系統(tǒng)充分利用大數(shù)據(jù)分析的優(yōu)勢,對不同的疾病相關信息做分類監(jiān)測,各司其職,高效地完成了醫(yī)護人員和醫(yī)療資源的調(diào)度分配,能在早期就發(fā)現(xiàn)疾病暴發(fā)的先兆,并及時阻斷傳播。我們相對而言還比較弱,但是在社會協(xié)調(diào)和社會動員方面遠強于其他國家,所以很快通過有力措施控制了疾病傳播。
而目前來說,不論是硬件還是軟件上,大數(shù)據(jù)分析都取得了十分大的進步,包括信息存儲能力、傳播能力,都不可同日而語,而在大數(shù)據(jù)分析手段上,如機器學習等學科的發(fā)展都為大數(shù)據(jù)分析提供了更豐富的方法和手段。因此,我們應該充分利用這些進步與優(yōu)勢,完善現(xiàn)代公共衛(wèi)生防疫機制,以大數(shù)據(jù)為核心做好疾病信息共享和應急救援的快速反應等。在現(xiàn)代化突發(fā)公共衛(wèi)生事件應對體系的基礎上,才能有效利用大數(shù)據(jù)防控傳染病。
當然,即便現(xiàn)在,和西方發(fā)達國家,尤其是美國相比,我們還有明顯的差距。首先是美國信息共享做得更好,這點在新冠肺炎流行的過程中我們就有了長足進步,很快就可以不弱于美國了。但是美國以東北大學為代表的學者們,開發(fā)了一套流行病仿真和預測系統(tǒng),可以把國家劃分成25公里乘以25公里的網(wǎng)格,知道這個網(wǎng)格中的人口密度,人口結構,家庭和企業(yè)規(guī)模分布,每日通勤人流情況。
另外,他們系統(tǒng)中還有所有這個網(wǎng)格之間的人流情況。這些數(shù)據(jù)來自很多部門和企業(yè),有些還用到了衛(wèi)星遙感來較準。這使得美國做傳染病流行預測非常準確,現(xiàn)在WHO做判斷基本就用這樣的系統(tǒng)。我很希望5-10年后,能在中國看到這樣一套系統(tǒng),這才是真正從根本上提高我們國家現(xiàn)在化防疫能力的舉措。電子科技大學和四川大學目前正在打算攜手做這個大計劃。
《為數(shù)據(jù)而生》,周濤 著,湛廬文化丨北京聯(lián)合出版公司2016年4月版。在這本著作中,作者列舉了許多真實案例,比如大數(shù)據(jù)在個性化醫(yī)療等領域的創(chuàng)新實踐等,為大數(shù)據(jù)應用提供了許多具有可行性的路徑指南。
新冠肺炎疫情的傳播
不僅是一個公共衛(wèi)生事件
也是一個重大公共事件
新京報:為了避免疫情悲劇往復重演,你提出,應當大幅提升疫情信息公開和數(shù)據(jù)共享的程度。在你看來,這個緊急公共衛(wèi)生事件的數(shù)據(jù)共享機制的建立,需要哪些支持?歷史上很多國家都進行過“數(shù)據(jù)公開運動”,有沒有我們可資借鑒的例子?
周濤:建立數(shù)據(jù)共享機制的基礎支撐,核心在于匯聚高價值數(shù)據(jù)。借助流行病病理學和傳播學特征,系統(tǒng)梳理和評估緊急公共衛(wèi)生事件中的共享數(shù)據(jù)指標的同時,建立數(shù)據(jù)回溯技術,對各數(shù)據(jù)指標的提供方的數(shù)據(jù)被查詢、下載的次數(shù)和產(chǎn)生的實際價值進行定量評估,形成高價值數(shù)據(jù)的匯聚。
其次,建立統(tǒng)一的數(shù)據(jù)上報系統(tǒng)標準,以及可靠、精確和具有獨立核查能力的上報流程,能夠?qū)ι蠄髷?shù)據(jù)進行核驗和追蹤,并保障社會公開的及時性。
最后,是各省市需定期針對緊急突發(fā)的公共衛(wèi)生事件進行必要的應急演練,在演習的過程中除了關注各部門應對能力,還需實時評估該數(shù)據(jù)共享機制提供的數(shù)據(jù)價值及發(fā)揮的作用潛力。
此外,從立法律面來說,國家可以通過立法和信息化的手段保證信息的強制上報,而且超過某種危險程度就要強制披露,不能把專業(yè)人士和老百姓都蒙在鼓里。
新京報:你此前翻譯過《大數(shù)據(jù)時代》一書,此書開篇便是大數(shù)據(jù)在變革公共衛(wèi)生方面的應用,比如2009年甲型H1N1流感。你剛剛也提到了這個案例,2009年甲型H1N1流感暴發(fā)的時候,與習慣性滯后的官方數(shù)據(jù)相比,谷歌成為了一個更有效、更及時的指示標,他們的預測與官方數(shù)據(jù)的相關性高達97%,和疾控中心一樣,他們也能判斷出流感的傳播源頭,而且判斷非常及時,公共衛(wèi)生機構的官員也從中獲得了非常有價值的數(shù)據(jù)信息。這對我們有哪些啟示?
周濤:近些年來,大數(shù)據(jù)理念已經(jīng)被廣泛推廣。然而,谷歌之所以能更有效且更及時的做出預測,除了理念外,谷歌所具備的數(shù)據(jù)資源、數(shù)據(jù)處理能力、數(shù)據(jù)統(tǒng)計能力是其能做出準確預測的前提。因此僅獲得數(shù)據(jù)并不能保證我們能得出有價值的信息,要知道谷歌在2009年預測甲型H1N1時,總共處理了近4.5億個模型,其數(shù)據(jù)分析處理能力可見一斑。
希望疫情結束后,我國應該進一步提升在數(shù)據(jù)處理方面的布局,針對突發(fā)公共衛(wèi)生事件,須建立一個基于數(shù)據(jù)驅(qū)動的個體流行病仿真實驗平臺,通過對流行病傳播模型的相關仿真和實驗能有效檢測流行病的預測準確性,同時也可驗證政府控制策略的有效性。從而在將來降低傳染病及流行病等對國民健康和經(jīng)濟發(fā)展的危害。
此外還需要強調(diào)一點,不同于09年谷歌基于搜索詞條數(shù)據(jù)的預測,目前新型冠狀病毒的傳播不僅僅是一個公共衛(wèi)生事件,也是一個重大公共事件,真相、謠言、吶喊和恐慌交織其中,搜索記錄受到的影響太大。因此還是要針對這次的具體情況,具體分析。
《大數(shù)據(jù)時代》,[美]維克托·邁爾·舍恩伯格、肯尼斯·庫克耶 著,周濤 譯,湛廬文化丨浙江人民出版社2012年12月版。在這本著作中,作者認為建立在相關關系基礎上的預測是大數(shù)據(jù)的核心。通過找到一個關聯(lián)物,相關關系可以幫助我們更好地捕捉現(xiàn)在和預測未來。
新京報:不過很多時候,大數(shù)據(jù)并不能解釋原因,只能揭示相互關系,這些關系性數(shù)據(jù)分析有時甚至會和傳統(tǒng)醫(yī)學的經(jīng)驗和看法相悖?!洞髷?shù)據(jù)時代》的作者認為,建立在相關關系基礎上的預測是大數(shù)據(jù)的核心。他提出,相關關系不僅能為我們提供新的視角,而且提供的視角都很清晰,而我們一旦把因果關系考慮進來,這些視角就有可能被蒙蔽掉。但這一觀點也受到很多批評。對此,你怎么看?尤其是在應對新冠肺炎疫情的當下,我們該如何對待大數(shù)據(jù)提供的信息?這次疫情或以往疫情中有沒有相關的案例?
周濤:關于相關性和因果性的問題,我在《大數(shù)據(jù)時代》的序里也發(fā)表過自己的看法。維克托本人也并非要完全放棄因果性,他本人也提出,挖掘因果邏輯是解決“數(shù)據(jù)獨裁”的必經(jīng)之路。對相關關系的重視多是從效率層面和當前主流的數(shù)據(jù)分析手段(譬如機器學習)來考量問題。我本人并不認同《大數(shù)據(jù)時代》中“相關關系比因果關系更重要的觀點”。從大處講,放棄對因果關系的理解,也就是放棄了人類智能的優(yōu)勢。
具體從這次疫情來看,新型冠狀病毒的宿主和中間宿主,乃至相關藥物疫苗的研究都需要反復論證其因果性才能得出準確的結論。而且在流行病防控這個領域,僅掌握關聯(lián)關系是不充分的,目前真正精確的預測模型,主要都是機制模型。純粹的關聯(lián)模型,無助于我們對關鍵因子的發(fā)現(xiàn),以及評估和設計防控政策。相關關系的確會更加有利于各類需求的預測并提供些全新的角度來理解問題,但如果僅是依賴相關關系的話,在當前漫天謠言的信息環(huán)境下,反而會加劇挖掘真相的困難性。
至于如何對待大數(shù)據(jù)提供的信息,我認為將其與流行病模型結合才是對大數(shù)據(jù)的最好應用。事實上,許多經(jīng)典的流行病模型在傳染病的預測效果已經(jīng)被反復論證,例如流行病動力學模型結合全球航空網(wǎng)絡的人口流動數(shù)據(jù)就準確預測了2003年的SARS和2009年的H1N1到達世界各個城市的時間。
但目前最為棘手的問題是,通常傳染病傳播初期,可利用的微觀傳播數(shù)據(jù)不僅稀少且缺陷較多,因此利用大數(shù)據(jù)彌補其不足,做出更及時、更精確的預測才是我們當前應該思考的重點。
大數(shù)據(jù)是完善防疫機制中
不可缺少的一環(huán)
新京報:大數(shù)據(jù)應用的前提是隱私和安全。但此前有新聞報道,一名從武漢坐高鐵回家的醫(yī)學生發(fā)現(xiàn)自己和幾百人的隱私信息,包括乘坐車次、姓名、電話、住址、身份證號等等,都遭到了泄露,給當事人帶來了巨大困擾。在你看來,在當前的疫情環(huán)境下,該如何合理利用大數(shù)據(jù),在防疫的同時保護人們的隱私與安全?
周濤:在此次疫情的防控中,人員流動的追蹤是最大的難點。在一級防控的需要下,公民隱私訴求要讓位于國家戰(zhàn)略。政府部門必須要針對來自疫情發(fā)源地人員進行必要的信息登記和追蹤。與此同時,我們又要做好相關數(shù)據(jù)的信息安全管理,特別對于基層治理的負責人,要強調(diào)信息安全的重要性,因為很多個人隱私都是他們不小心泄露出去的——如果對他們進行了簡單的培訓,就可以避免這樣的問題。
新京報:大數(shù)據(jù)防疫有好的方面,但也有其局限性,有時候會被錯誤解讀和利用,造成一些誤導性的“謊言”,如果在隱私和預測方面對大數(shù)據(jù)管理不當,或者出現(xiàn)數(shù)據(jù)分析錯誤,導致的不良后果會很嚴重。你如何看待大數(shù)據(jù)可能產(chǎn)生的負面影響?對于大數(shù)據(jù)的應用,你有哪些反思?
周濤:流行病的傳播模型是相關學者常用的一種計算和預測方法。然而,針對任何一場實際發(fā)生的疫情傳播,由于實時流行病學的信息極為有限,輸入數(shù)據(jù)過少,考慮的影響因素簡化,同時,還存在一定的數(shù)據(jù)真實性問題,其計算和預測結果都有一定的局限性,只能提供大體趨勢。但這對于疫情的防控措施開展,其相應的計算思路和結論,還是能起到一定的參考作用。通過不斷引入更多參數(shù),提高數(shù)據(jù)輸入量,也可以較大程度地提升相關模型預測的準確性。
新京報:關于現(xiàn)代公共衛(wèi)生防疫機制的完善,大數(shù)據(jù)可以在哪些方面發(fā)揮貢獻?未來是否需要由國家來主導建立基于日常衛(wèi)生防疫防病的大數(shù)據(jù)系統(tǒng)?
周濤:現(xiàn)代公共衛(wèi)生防疫的優(yōu)勢在于信息傳播的高效和數(shù)據(jù)分析的技術手段的提高,而大數(shù)據(jù)則是完善防疫機制不可缺少的一環(huán)。
一方面,可以利用大數(shù)據(jù)對全國甚至全世界的疾病情況做監(jiān)測,這樣可以在傳染病暴發(fā)初期就能及時識別并做出反應,做好阻斷措施和安排好醫(yī)療資源等,避免因早期的誤判、認識不到位等加重疫情。這其實就表明了建立基于日常衛(wèi)生防疫防病的大數(shù)據(jù)系統(tǒng)的必要性,我們需要更系統(tǒng)化和更全面的數(shù)據(jù)來對各種疫情進行分析和防控,這也決定了必須由國家主導,才能組織好各地的數(shù)據(jù),在保障隱私和數(shù)據(jù)安全的同時對數(shù)據(jù)進行有效利用。
另一方面,就像剛剛提到的,在保障病人隱私的基礎上,可以建立緊急公共衛(wèi)生事件的數(shù)據(jù)共享機制,常態(tài)化各地疾控中心的數(shù)據(jù)共享,方便有緊急突發(fā)事件后,各地能夠快速組織專家進行研究分析研判。
新京報:關于新冠肺炎疫情,你還有什么具體的感受、預測或者建議?
周濤:我們初步計算的新型冠狀病毒的基本再生數(shù)在2.2-3.1之間,因此可以基本判斷病毒的傳染性屬于中等偏強,總體上可防可控。但由于前期缺乏對新型病毒的了解以及各類原因,我們錯過了第一時間有效抑制傳染病傳播的最佳時間,而且新型冠狀病毒在潛伏期也有較弱的傳染性,而且輕微癥比例高,較之03年SARS更難控制。這一次我們更早實行外部干預,加之各界群眾都積極的參與到疫情的防控中去,只要控制住傳播,我們完全有能力將病毒的基本再生數(shù)降低到1以下,贏取抗疫的最終勝利,所以我認為大家完全沒有必要恐慌。當然,大家也不能過度樂觀,認為可以短平快打一場殲滅戰(zhàn)。我們可能需要打一場持久戰(zhàn),但是只要新增感染者總數(shù)走低,隨著有效的疫苗和治療手段的出現(xiàn),情況肯定越來越好。給大家的建議還是盡量減少和人的接觸??傮w來講,我希望這一場戰(zhàn)役之后,中國能夠建立起以現(xiàn)代信息技術為基礎的現(xiàn)代化的防疫體系,再把中國的防疫力量提高一個層次。
新京報:最后一個問題:當下正值復工潮的到來,屆時數(shù)據(jù)分析之后,您覺得能夠在哪些方面給公共防疫政策一定的建設性意見?
周濤:我們正在聯(lián)合華西醫(yī)院、市大數(shù)據(jù)公司、四川大學、電子科技大學等團隊,討論建立一個成都市的居民防疫信息管理服務平臺。期望通過全市居民防疫信息的快速采集、實時分析、精準上報、服務推送等融合性應用,幫助市民、醫(yī)院、政府等各方面快速掌控疫情分布情況,提高防控部署的決策效率。
具體來說,我們將個人填報的數(shù)據(jù)與政府數(shù)據(jù)、第三方平臺數(shù)據(jù)打通,實現(xiàn)“一人一檔”的個人防疫信息,通過多源數(shù)據(jù)的匯集和計算,一方面可能為居民提供諸如感染概率指數(shù)預測、實時的防護建議、高風險感染人群的智能篩查等個體防疫服務,另一方面,可對政府的區(qū)域防疫工作提高精準度和效率,繼而為如醫(yī)療資源調(diào)配、防控措施實施等政府管理行為提供決策支撐。
另外,我們也正在研究以一種便宜和簡單的方式,在交通樞紐、學校、寫字樓、產(chǎn)業(yè)園區(qū)以及其他人員聚集地,通過熱成像的方式,對進出人員進行無感知且快速精準的體溫測量,對工作人員每3-4小時用便攜式熱成像設備進行無感知的體溫測量。我希望最終體溫測量能夠變得很便宜很簡單,和門禁、安防等設備直接集成起來,這樣我們以后控制疫情手段就先進了,因為發(fā)熱是很多傳染病的重要癥狀。有了這個,我們控制重型流感就有了更有力的武器,大家不要小看重型流感,帶來的損失很驚人。
{{item.content}}