Skip to content

熱文:記錄一下首次發現新型冠狀病毒的經曆

2019年12月26日剛上班,還是如往常一樣先大概瀏覽一下這一天的mNGS病原微生物自動解讀結果,沒問題的話就開始一天的研發工作了。

意外的是,發現有一個樣本報出了敏感病原體——SARS冠狀病毒,有幾十條的序列,且這個樣本隻有這麽一個有意義的病原體,如果是普通病毒,這已經是一個相當可靠的結果了。心頭一緊,趕緊後台查看詳細的分析數據,發現相似度並不算很高,隻有大約94.5%(這跟卡相似度的閾值有關,相當於隻篩選下了相似度比較高的序列)。想到有幾種可能:1、SARS不同毒株基因組有一定差異;2、RNA病毒容易突變,距離SRAS事件17年了,變異比較大;3、近緣物種的錯誤比對等等。為了確認結果的可靠性,開始了詳細分析。

好在之前已經遇到過幾次這種類似的敏感的病原體確認分析工作,而且領導也曾跟我討論過幾次能不能做一個新發病原自動挖掘的分析流程,心裏一直記著這個事情,在做其他權重更高優先級更高的項目時也隨手做了一個初步的版本出來,
這個樣本剛好可以派上用場。我給它起了個名字,相比於日常生產用的分析流程,它多了個後綴:“探索版”,包含了幾乎所有已測序的病毒基因組。

探索版的分析結果提示這個病原體跟Bat SARS like
coronavirus最相似,整體相似度在87%左右,而跟SARS的相似度是約81%。比對上的序列數由幾十條上升到了500多條,此外也組裝出了5條contig,加起來有1200多bp,此時基本上可以確認是一種冠狀病毒,可以針對冠狀病毒進行詳細分析。分析期間也開始跟解讀負責人和領導小範圍內部保密討論。

dc74952194ecab11ddd8cc654841e9b2

進一步分析,無論是拿原始序列去NCBI nt庫blastn,還是拿組裝後的序列去blastn,結果都是跟Bat SARS like
coronavirus最相似,但整體的相似度也是隻有87%左右,進行nr庫蛋白blastx對比的相似度也差不多,因此對結果保留懷疑。

689fa4e88c17d559c9504f513cfcc4cf

病毒的分類信息一直都很混亂,分類規則不統一,有些基於分型基因(比如甲流)、有些則沒有明確的分型基因,通過其他方法去分類。此前並沒有去調研過Bat
SARS like 跟SARS的分類方法,在NCBI Taxonomy上,Bat SARS like
是劃分到SARS下麵的。如此緊急的情況下,沒有時間去調研文獻,手上的數據也不多,基於基因組的相似度,潛意識裏認為既然Bat SARS
like是SARS的下屬分類,那麽這個檢測到的未知病毒至少也是一個跟Bat SARS like平行的物種,即一個新型的Bat SARS
like(後來看文獻SARS和Bat SARS like是通過幾個非結構蛋白進行分類)。

e724d0d10cb6d66c06e3f0e753aa92e4

進一步地毯式地分析了幾千個冠狀病毒基因組,從相似度、覆蓋率、基因組分布均勻等幾方麵進行評估,最終找出兩株最相似的基因組,bat-SL-CoVZC45和bat-SL-CoVZXC21(1月9號公布基因組序列後,很多文章分析的也是這兩個)。

(下午才發到群裏的圖)

b407f6b3b5a2765e71014496d164a680

僅僅這些信息還是不夠的,至少還要看看進化上的信息,於是開始著手做進化樹分析。

664837e113983fcd5dd2dd6d6327ab18

下載了所有冠狀病毒的基因組,最後經過質量過濾、聚類等分析,篩選出了160株的冠狀病毒基因(基本包含了所有已知的各種動物的冠狀病毒)。將組裝的序列與160株冠狀病毒基因組基於全基因組平均相似度做了進化分析(題外話,個人認為在物種進化分析上,基於全基因平均相似度構建進化樹,比基於某個基因構建的進化樹要更準確、合理一些,畢竟是從全局來考量,當然,研究結構、功能等另說,此時組裝的序列也很短,沒有完整的基因序列),結果不出意外,還是跟Bat
SARS like coronavirus聚得最近,而且也是在SARS的大支上。

(跑到了傍晚才出圖)

4999cb1f8b36650a132452517030c176

5cf275f7b58e3e1a5f263b4ec55489ba

36aacf889792c2670dbda5729af16ff4


圖注:左上角一大塊紅色是SARS,邊緣顏色沒那麽紅的是Bat SARS like,再往外的大藍邊是另一群Bat SARS
like,未知的病毒跟45、21聚在比較獨立的一支上了,紅框圈起來的。

比較奇怪的是,這個未知的病毒跟bat-SL-CoVZC45和bat-SL-CoVZXC21聚到了一個相對獨立的分枝上,而其它Bat
SARS
like則很集中地聚在SRAS那一群裏麵,想著也許是這兩個的分類有點問題,但去看了出處的文獻,方法上跟其它的也沒啥區別,尊重文獻的分類吧,暫且認為是對的。(這也是後麵某些專家們把這個未知病毒判定為新型冠狀病毒的依據之一)

a0b74b6ad8a75a11244aea1e578f0a13

(部分進化樹截圖)

前端反饋這個患者病重,著急要檢測結果,但是這麽一個重大的病原體確實不可輕易報出,中午跟幾個領導緊急開了個會,決定繼續深入分析,延遲發放報告,同時分享數據給中國醫學科院病原所一塊分析。

後麵從基因層麵(orf1ab、S、N等基因)進行了深入分析,並沒有什麽意義比較大的發現了,主要還是檢測到的序列數少,覆蓋率太低,都是不完整的基因,做不了什麽。

2420a2684ee702f7f739cac68ec3530f

中午時已經提出了重測補數據進行分析。重測可以進行技術重複性驗證,避免一些未知因素的汙染導致的假陽,確保樣本確實有該病原體,另外可以有更多的數據進行分析,如能組裝出完整的基因組,分析結果更可靠,能做的深入分析也更多。

eeb67ba6dfce87a60e189fb6d956b451

第二天(2019.12.27)一早數據出來後,趕緊進行了組裝分析,終於組裝出了接近完整的基因組序列。數據同時也共享給了中國醫學科學院病原所做其他深入分析。這次的序列數由之前的500多條升到了47萬多條!

98b7084d60014b8bbdf6e7671063de90

c3c4047cffb7eeb74b418e1b48ec2be7

因為時間有限,還有其他研發項目需要做,就沒有詳細去對組裝結果進行補gap獲取完整基因組了。另外也已經分享數據給病原所了,他們也會做這個,所以就沒有去組裝出一條完整的基因組序了,已有的組裝結果能滿足大部分分析需求了。

後麵也繼續做了一些深入的分析。

回帖序列分布均勻,沒有明顯的偏好,平均深度和中位深度基本一致,深度達到了1000x,說明組裝沒啥問題,測序也挺好,未知病原體也是完整的基因組存在。

c81d5ac4ff1d80850dff4ee4baa79185

重新構建了進化樹,這次選擇了NCBI所有冠狀病毒的參考株(以登錄號以NC開頭,官方認為最可信的),外加幾株前一天分析最近源的株。

0d21812028846beb3a93da972d8d4958

進化樹結果跟前一天的基本一致。

f11c3a49055313b6564ec34ef4f2e2fa

基因組共線性分析、ORF注釋等表明這個未知冠狀病毒是典型的BetaCoV(orf1ab、S、M、N、E等基因)。共線性圖裏顏色較淺的是S蛋白區域,是差異最大的基因。

7ba98c9091c873aeccec4de2bb93e5ea

經過與WHO官網推薦的SARS
7條PCR驗證靶標序列比對,發現平均相似度也隻有90%左右,關鍵是引物序列也有幾個變異,推測SARS的檢測試劑盒無法檢測這個未知病原體(後麵的很多地方的實驗驗證也是如此)。

此外還做了很多其他針對基因、蛋白等詳細的深入分析,不再贅述了。

分析至此已經基本可以確認這個患者的樣本裏麵確實有一個病毒,但這個病毒與所有已知基因組信息的病毒都不太像,可能是一種跟Bat SARS
like coronavirus類似的新型病毒。

f257828a0dbb916987817c574fc69109


(現在看回我當時的那句話,真是一語成讖,對不起全國人民了,都怪我這個烏鴉嘴)

這不一定是SARS,傳染性、致病性都未知,同時也意識到了問題潛在的嚴重性,對實驗室做了全麵清理消毒,樣本無害化銷毀,實驗操作相關人員進行了相關監測。

接下來就是怎麽去報告的問題了,直接報可能會嚇著醫生,何況這可能是一個新發病毒,報錯了就是重大的事故。有一些必要的信息還是需要先進行排查的。

最先想到的當然是野生動物接觸史,當時得到的信息是這個病人回過老家,不排除接觸過蝙蝠,或者被蝙蝠咬了都可能。

914810cf110b620a2cef98fa84f81704

也曾懷疑是不是哪裏的人工病毒相關工作人員操作不慎誤感染,畢竟前段時間的布魯菌集體感染就是因為某個工廠滅菌不徹底引發的。

d47846780d07b7745e8b62601348e7dd

沒有更多信息了,還是要趕緊跟醫生溝通這個事情,畢竟我們能保證送檢的樣本裏麵就是有這個未知病毒,其他事情就交給醫生去調查處理了。

中午前已經跟醫生溝通了,患者也隔離了。

8ebdc1837c37ac44f353ebea83df0ab5

因為沒有掌握其他更多信息,患者也隔離了,這個病毒又不是真正的SARS,想著或者僅僅隻是個野生的Bat SARS
like,傳染性未知,所以緊張的心情也有些放鬆了。但因為患者病重,也不容小覷,仍然密切跟醫院溝通中。期間也在繼續做一些深入分析。27號、28號公司領導也在跟醫院和疾控的人電話溝通這個事,29號、30號還親自去武漢跟醫院、疾控中心的領導當麵匯報交流這個事情,包括所有我們的分析結果以及醫學科學院病原所的分析結果。一切都在緊張、保密、嚴格的調查中(此時醫院和疾控的人早已經知道有多名類似患者,我們溝通了檢測結果之後已經開始了應急處理,但我不知道而已)。

本以為這個事情會很快過去,畢竟除了這個患者,好像也沒有聽到其他患者感染的消息,但到12月30號的時候,聽到消息說類似症狀的患者還有挺多個,神經又一下子繃緊了。特別是,大概是30號下午吧,一個“友商”在另一個患者的樣本裏麵可能也檢測到了同一種病毒,但他們直接發了檢測到SARS冠狀病毒的報告,瞬間把消息給引爆了。晚間相關部門也發了“不明原因肺炎”的公告,31號淩晨時相關流言也開始在微博上大肆傳播。

真正讓我再度緊張的是,友商共享了序列給我們分析,我分析一看,確實就是同一種病毒!潛意識裏的第一個想法就是“這病毒具有傳染性”!可能還真是一種新型的SARS!

30號深夜拿到友商的序列進行分析。

73369aa4092185906bbc5d494efdf582

446fa0ed226e2aea614de35ea617647f

兩個未知病毒聚在了一起,相似度超過99%

6fcf3476a0da7ee7fd8888942d23ded7


(由於友商的序列是經過與SARS比對篩選的,所以跟SARS相似度達到93%,而我們的完整的序列則約86%,但兩者的同源性還是接近100%)

b2a98ed8e448a152acd216ec88722b73

兩兩直接比對,所有序列均能比對上,相似度達99.6%,再保守的區域,不同物種間的相似度幾乎不可能這樣高,而且全基因組覆蓋率超過了20%,確認是同一種病毒無疑!

820c8f8ce2160c8eb73a6115a8f42841

此時的心情既很緊張,也很激動。緊張在於,這個未知的病毒可能會像SARS那樣恐怖;激動在於,我們通過mNGS技術及早發現並確認了這個病原體,並且對患者進行了隔離,在病毒大範圍傳播之前有可能通過防控措施把它扼殺在搖籃中!

心情複雜,感慨萬分,隨即發了條沒幾人能懂的朋友圈。

6af8f68cb0afb8b813635c0df6f8463a

12月31號早間,微博上關於SARS的流言開始大肆傳播。我一直在等著看官方如何回應。下午官方發布通告,隻說了是“不明原因肺炎”,
並未提是什麽病原體,有27例類似的病例,其中7例重症。看到這個消息後,我感覺事情不妙了,猜測這個病毒傳染能力並不低。然而官方的通報卻是“未發現明顯人傳人現象”,早期掌握的數據並不多,局勢不好判斷,何況是新發病毒,為了穩住社會情緒,避免民眾過度恐慌,這樣的通告其實也可以理解。

此時專家組已經開始介入,武漢病毒所等“國家隊”也開始分析鑒定,他們知道更多信息,有更多樣本和數據,也更有條件更專業,所以後續我就沒有做太多深入分析的工作了,等待官方的結果。

剛開始我對國家在處理這些突發的重大公共衛生事件的能力還是挺有信心的,畢竟經過了SARS、甲流等事件的洗禮。此外,就在兩個多月前的北京鼠疫事件,也是由我們通過mNGS檢測出來上報的,當天上報後他們就啟動了應急處理程序,馬上用了其他方法再次驗證,第二天一早就看到新聞了,後續也沒有發現新傳染的病例,防控做得很好。mNGS在鼠疫事件中立了大功,想著在這個未知病毒的防控中也能起很大作用吧。

媒體開始辟謠,最早見新京報發出“SARS係謠言”,人民日報等則用詞稍微委婉些“不能斷定是SARS”,後麵8位“造謠”的人被抓了。看到這些新聞後,不知怎麽的,心裏突然有點失望了。科學上尚未有定論或者有爭議的東西,直接就是謠言了?開始有一種感覺:這種辟謠的論調,以及那些過度樂觀的宣傳都會把這個事情推向難以挽回的局麵。媒體的高調辟謠會幹預這個病毒科學的定性,過度樂觀的宣傳會讓大眾缺乏敬畏之心,不會采取防衛措施。後續事態的發展又一次驗證了我的擔憂。

事件引爆了以後,也有些朋友來問我是否知情,特別是武漢的朋友。在告知一定要先嚴格保密後(畢竟有人被抓了),我還是透露了一點消息給他們,讓他們一定要注意防護。

d0968ddcbfdcaefe724f750d505b592f

8ee62197bb22798eeb166aa22a2a3346

這個對話或許也能理解為什麽要辟謠SARS,以及命名為新型冠狀病毒,畢竟基因組相似度隻有80%左右(題外話,腸道病毒同一個型別的不同毒株,很多的相似度也才80%左右),SARS給我們帶來了太多創傷,大眾對其極為恐慌。

380467e947af4ebdda84f64fc67eba1c

新型冠狀病毒和SARS不同的基因的相似度不同,從75%到94%不等,特別是S基因,與人細胞受體(ACE2)相關,相似度才75%。所以說不是SARS,那也算是有依據吧。不過後來石正麗的文章中,通過他們的方法分析,新型冠狀病毒也是屬於SARSr-CoV(SARS相關冠狀病毒)。

事件後續的發展大家都知道了。這裏再說說幾個問題。

為什麽我們兩天就已經分析出了這個未知的病毒是一個跟SARS很像的冠狀病毒,並且上報了所有分析結果,官方要到1月7號才發布消息明確肺炎是由新型冠狀病毒引起的?

其實我們做的工作隻是分析鑒定了送檢樣本裏麵有這麽個病毒,但肺炎是否是這個病毒導致的,我們並沒有去分析,也無法去分析,檢測到病毒不等於肺炎由該病毒引起。如此重大的衛生事件,官方自然要嚴謹論證,而且也有一套國際參考驗證流程(科赫法則)。官方要做的不僅是檢測到多個樣本都有這麽個病毒,還要驗證肺炎是因為這個病毒導致的等等。

52a2f15f2e55ed61c2a61c62d9731c40

分離、培養、驗證等等這些都是很花時間的,還要經過專家討論,達成共識。從近段時間發表的很多關於新型冠狀病毒的論文上也可以看到,很多測序數據都是在1月份的頭兩三天就完成了的。

這個事情還有一個很感概的事情就是,知道真相的人噤如寒蟬,不知道真相的人各種“大力科普”、“深度分析”;親身經曆的公司隻字不敢言,其他公司各種借勢營銷。從鼠疫到新型冠狀病毒皆是如此,嗬嗬,好有意思。

要談對整個事件的看法,最大的感覺就是失望,痛心,還有憤怒。我們都已經發現那麽及時了,為啥現在還是沒能控製住?讓全國進入的疫情大戰?更多的不是科學因素,也不是技術因素,而是決策和媒體。

我曾經是個很憤青的人,事已至此,無力回天,傳遞信心才是最重要的吧。馬後炮,人人都是精英,誰都不曾想到事情發展成這個樣子,所以也懶得去批判很多事情了。但有些話還是想說幾句。

辟謠SARS、媒體宣揚的樂觀情緒,這些在最早期的時候都沒有太大問題,畢竟對這個病毒的認知非常有限。在應對這些重大公共衛生事件時,疾控係統可能采用“內嚴外鬆”的規則,內部謹慎小心、嚴格驗證、仔細評估,對外通告卻可能偏向樂觀,避免引起過度恐慌。何況在這次事件上,怎麽去給公眾交代,顯然已經不是疾控係統能單獨決策的事了。

武漢交通樞紐的地位不必多言,當時也臨近春節,正是餐飲、旅遊、電影等服務業的旺季。悲觀的宣傳無疑會重創這些服務業,還會引起大眾過度恐慌,導致物資哄搶,社會混亂等嚴重後果。若這病毒真無什麽傳播能力,或者因為采取了這些措施扼殺了病毒的傳播,社會沒看到這個病毒能帶來什麽危害,決策者必然會被罵反應過度、小題大做,到時自然要背鍋。相反,過於樂觀的宣傳,病毒不強則皆大歡喜,開心過大年,病毒強則會導致大眾缺乏防範意識,防控工作難以展開,最終導致病毒的快速傳播,產生更加嚴重的後果。所以,當你作為一個決策者的時候,你不得不綜合考慮方方麵麵的因素,社會、經濟乃及政治各方麵都需要做一個平衡,非常考驗決策者和專家們的能力和遠見。

走對了,平淡無奇,走錯了,千古罪人。

這個世界沒有平行宇宙,我們無法知道哪種決策才是更正確的,或更錯誤的。在國內這種什麽事情都喜歡往樂觀上麵宣傳的大氛圍下,以及僥幸心理的存在,決策者做什麽決策,可想而知。

在事件的後期發展中,特別是1月12號左右開始,我相信專家們已經看到事情正在往不好的方向發展了(首批確診的41例患者,約30%並無海鮮市場接觸史,此時多地開始出現疑似病例了,有些已經初步核酸陽性)。但是在後續的宣傳上還是太過於樂觀和藝術化了,同時還在不斷辟謠,還沒任何發布預警的跡象。“不排除有限人傳人,持續人傳人風險低,可防可控”,用詞頗為謹慎講究,且不說是否過於樂觀,就問有多少普通民眾知道什麽是“有限人傳人”?什麽是“持續人傳人”?他們的理解可能就是基本不會人傳人,自然毫無戒備之心。我還在朋友圈科普了一下。

50a0861498ecbf97fcfc2a994b97c417

從現在發表的很多論文上也可以看出,很多專家很早就對這個病毒的傳播能力有較深的認識了,越往後,掌握的數據越多,對局勢的預判越清晰。我相信專家們早已給出不怎麽樂觀的預判,但如果某些人,為了顧及某些人或某些媒體的麵子(畢竟之前宣傳得太樂觀,現在打臉太疼),罔顧專家意見,不顧民眾健康,不得不往樂觀上麵去通告,堅持不發布預警,這就不可原諒了。無論是誰,該罰的罰,該撤職的撤職。

別的不多說了,談點希望吧。

mNGS確實是一個好技術,在疑難、危重病例診斷以及這種突發的重大公共衛生事件的早期監測和爆發監測中起到很大的作用。現在提供mNGS病原體檢測服務廠商有很多,建議疾控係統可以跟一些技術好的企業建立直接溝通的渠道,能夠更快速地應對像這樣的突發事件。另外,mNGS企業們也可以建立一個信息共享平台,在遇到這些事件時及時共享信息,看看是否有爆發(我知道這個很難,一方麵本來就是商業機密,另一方麵敏感病原體誰都不敢輕易報吧,但我還是覺得這個事情很有意義,希望有朝一日可以成為現實吧)。

也希望我們經曆了這次新型冠狀病毒事件後,國家的重大公共衛生事件的處理能力有長足進步吧。個人認為,在通告宣傳上可以借鑒天氣預報的規則——“總是會往危害大些方麵去預報”,以提醒民眾做更多預防,降低心理預期。俗話說:沒有期望就不會失望。

這件事情對我而言,仿佛就是一場年終大考,用盡所學,交了一份還算合格的答卷吧,隻是這份答卷是否發揮出最大的作用了呢?第一次親身參與到了一次如此重大的公共衛生事件,做出了一點貢獻,也鍛煉成長了許多。

據我目前所知,最早發現這個病毒的應該就是我們了,因為也是我們上報結果以後,疾控係統開始介入。從GISAID數據庫網站上提交的數據看,樣本收集的時間也是我們最早的。也許其他機構也測到了這個病毒,但這是未知的病毒,核酸數據庫中沒有參考基因組,他們不一定有這個生信能力去分析鑒定。

feb2a47a1783bc2df0926fdeb199505d

所以,應該就是我們首次發現了這個新型冠狀病毒吧,記錄一下。

希望早點戰勝疫情吧。

中國加油!武漢加油!

2020.01.28

華客網:熱文:記錄一下首次發現新型冠狀病毒的經曆