完了,這回我眞看出問題了。還是序列比對,之前有個地方我沒注意,就是S蛋白(spike)中閒有一個內切位置,在病毒進入細胞後,蛋白內切酶把S蛋白切成兩個亞基,在很多冠狀病毒一般是由胰蛋白酶(trypsin)完成的,包括SARS等。
這次問題就是在這個內切位置上了。之前我比對序列的時候,沒有留意這個位置。而這個位置正好是Covid-19和其它所有毒株,包括與其最近的雲南蝙蝠冠狀病毒 RaTG13都不同的(穿山甲在這段和Covid-19更遠),而且這前後的序列相對都比較保守(圖1,第1條序列是Covid-19,第2條是雲南蝙蝠RaTG13,第6條是人SARS)。Covid-19插入了4個氨基酸殘基(PRRA,即脯氨酸-精氨酸-精氨酸-丙氨酸),而前後的序列相比RaTG13都沒有變化。4個殘基就是12個核苷酸鹼基,並不是一種很容易發生的突變。而這一突變正好造成了一個furin內切酶識別位點。
furin是一種蛋白內切酶,識別的蛋白序列爲RXXR(R是精氨酸,X是任一殘基)。PRRA加上後面緊跟着的R正好形成了furin識別位點。我覺得有問題的頭一點是在保守區引入了這樣一個插入,形成了識別位點。(之前我寫過一篇東西,說印度團隊的分析不靠譜,是因爲他們分析說有插入的地方太不保守,不同毒株什麼樣的長度都有。但這次是只有Covid-19與別的株不同。)因爲這個地方正好是切開兩個蛋白亞基,多兩個少兩個殘基一般並不很影響蛋白構象。
再看,這個位點會不會是被人有意引入的呢?結果發現,2009年眞就有人做過實驗了,發在PNAS上,就是把SARS在這個位置的RSTSQ變成了RRSRR,即引入了furin識別位點(原先是胰蛋白酶(trypsin)的識別位點)。結果發現病毒侵染效率提高了(圖2)。
所以,這個地方眞的很像人工設計的了。不過現在還沒有一個除這個位點以外其它部分都特別像Covid-19的母本病毒序列被公佈。
參攷文章:
李鑫 (2020) 武汉2019冠状病毒S蛋白可能存在Furin蛋白酶切位点
网页链接Wong MC (2020) Evidence of recombination in coronaviruses implicating pangolin origins of nCoV-2019
网页链接Belouzard S (2009) Activation of the SARS coronavirus spike protein via sequential proteolytic cleavage at two distinct sites
网页链接