Skip to content

牛津學者:帝國理工的武漢疫情預測幾乎沒參考性

江熹霖,基因組醫學與統計學在讀博士,牛津大學人類基因組中心 (Wellcome Centre for Human
Genetics) & 牛津大學大數據中心 (Big Data Institute)

  新型冠狀病毒起源於武漢,因此估算武漢最初感染人群數量對於疫情分析有很大幫助。除了通過當地的醫院具體病例排查外,通過其他側麵數據對感染人群數量進行預測也能夠為掌握疫情情況提供支持。

  1月17日,英國帝國理工大學團隊 (Natsuko et
al。)通過武漢出境人數及境外人數患病人數,對於武漢1月12日前患病人數進行了估計(1723人)。他們的邏輯非常簡單,假設每個武漢市民隨機進行國際旅行,那麽從武漢出國的人中,患病的比例和武漢市市民患病的比例是相同的,通過國外確診的人數,就可以反推出來武漢當時的患病人數。

  這個方法看起來非常直接,但是有些很重要的因素不能被忽視,比如,中國2019年公民持有護照率隻有13%,因此僅僅考慮海外病例對於整個武漢市情況的估計會有較大偏差。當然,在Natsuko
et
al。工作中,他們也對這種情況進行了討論,他們聲明,自己的研究是假設在每個武漢人出境的概率是獨立的。但是此次疫情的起源地是武漢華南海鮮市場,地處漢口市中心,因此附近易感人群進行國際旅行的概率可能顯著高於他們模型中所采用的1900萬人武漢都市圈。
與此同時,根據疫情溯源研究,大多數最初病例都於華南海鮮市場的野味消費有關,而野味消費被認為是奢侈消費,相關人群高收入概率更高,也更有可能進行國際旅行。因此,這個模型的假設可能並不成立。

  為了更精確地預測武漢最初發病人數,我們對Natsuko模型的進行了穩定性測試,假設武漢市區隻有護照持有者才有可能進行國際旅行(這個是顯然成立的),而非他們模型中假設的武漢都市圈1900萬人都有相同概率進行國際旅行。當武漢華南海鮮市場易感人群有50%的持有護照時,根據Natsuko的模型,預測結果為1月12日前有281位感染者(95%置信區間56-671),而如果易感人群護照持有率為80%時,同樣的預測結果為175人
(95% 置信區間
34-417)。而在原模型中,他們的推算結果為1月12日前武漢有1723名患者。這意味著目前的數據模型對於假設的依賴極強,估算的不確定性很大,甚至可能有10倍以上的誤差。(見下表)

c2d3 innckcf6082981

  同時,該模型的核心數據是海外檢出的3例病例,而這樣小的樣本會導致較大的置信區間,也就是預測的不確定性。在模型有高度不確定性的情況下,模型估計的範圍上下可能有10倍以上的差距,用這樣十倍以上偏差的結果來對疫情進行估計,實際指導意義並不大。

  除此之外,在模型的檢測窗口參數的選取上,他們使用的以往SARS及MERS-CoV的經驗數據10天。而對於新型冠狀病毒的研究顯示,病毒的平均潛伏期為7天,中位數發作住院間隔為9天,因此使用16天作為檢測窗口更加合適,而這也將導致原估計從1723調整至1079人。還有其他假設有待商榷,例如國內外檢測手段的差別等,不再一一討論,但以上均說明Natsuko模型的預測結果對於假設的依賴較強,而很多假設成立的可能性不大,因此預測的準確度有待進一步檢測。

  1月23日,帝國理工大學團隊 (Natsuko et
al。)又發布第二份報告,運用同樣的模型將他們的預測從1月12日延伸至1月18日,計算出截至2020年1月18日可能有4000例患者。但是,1月10日開始的春運,以及從1月14日開始的機場火車站發熱篩查,導致模型中的“機場覆蓋人口”、“出境居民獨立性”等假設被破壞嚴重,而第一份報告中的問題依舊保留,因此,用Natsuko模型對1月12-18日進行的估算準確度很低,幾乎沒有參考性。

  值得注意的是,我們這裏並不是斷定帝國理工大學的預測結果可能偏高或偏低,而是僅僅說明其預測的準確度非常低,可能大幅偏高也可能大幅偏低。同時需要注意的是,目前疫情已經從武漢擴展到全國,且武漢的交通已經受到嚴格管控,而該預測模型是利用海外患者數量這個與當地疫情聯係較弱的因子進行預測,同時預測的目標也僅僅限於武漢市(目前確診的海外病例均與武漢市相關),從研究意義上,這個模型對於了解目前疫情全貌的幫助也有限。

  從1月17日起,疫情已經擴散至其他省份, 而目前其他省份的確診數量與地區與武漢交通關聯密切程度直接正相關,
但湖北省內其他城市與武漢的交通關聯度最高,卻沒有足夠多的確診報告。在目前階段,基於各地醫療機構的實際數據(包括疑似病例數,疑似病例確診率,就診率等),結合春運前期的交通數據,對這些與武漢高度關聯的城市的病情進行分析,對於掌握疫情整體情況是最為重要的,而非Natsuko模型這樣利用相關係數較低的海外病例來對單個地區進行估測。

  通過交通數據預測,湖北省內各市,河南、湖南的疫情可能被低估,有必要結合當地疫情數據及交通情況對這些區域的疫情進行測算。同時,鑒於交通關聯性對於疫情擴散的顯著作用,感染人數很可能在春運後半程有較大上升。測算交通壓力帶來的未來疫情變化,可能是目前流行病學計算的工作重心。

華客網:牛津學者:帝國理工的武漢疫情預測幾乎沒參考性