基于機器學習翻譯,僅供參考
在本教程中,您將使用Geneious使用分子系統發育工具來研究人類免疫缺陷病毒(HIV)的進化起源。您將學習如何從序列比對中構建系統發育樹,以及如何查看和操縱樹以回答有關HIV-1起源的問題。
介紹:人類和猴免疫缺陷病毒
練習1:系統發育 - 建立HIV和SIV的系統發育史
練習2:HIV和SIV的分子系統發生學
練習3:HIV-1大流行的起源
追求性價比的G級抗體生產與OEM服務提供商
追求效率與質量的生物實驗外包服務提供商
生物醫學科學研究重點技術領域儀器供應商
不斷提供生物領域未知未涉的分析軟件整合服務商
基于機器學習翻譯,僅供參考
在本教程中,您將使用Geneious使用分子系統發育工具來研究人類免疫缺陷病毒(HIV)的進化起源。您將學習如何從序列比對中構建系統發育樹,以及如何查看和操縱樹以回答有關HIV-1起源的問題。
介紹:人類和猴免疫缺陷病毒
練習1:系統發育 - 建立HIV和SIV的系統發育史
練習2:HIV和SIV的分子系統發生學
練習3:HIV-1大流行的起源
艾滋病毒是獲得性免疫缺陷綜合征(艾滋病)的原因,與猿(猴子和猿)免疫缺陷病毒(SIV)密切相關。這些和其他類似病毒是逆轉錄病毒。逆轉錄病毒的特征在于它們的RNA基因組,一旦在宿主細胞內,逆轉錄成DNA然后整合到宿主細胞的基因組中。整合的病毒基因組被稱為原病毒。您將與前病毒DNA序列一起工作。
當這些病毒在20世紀80年代初被首次發現時,艾滋病病毒的起源是神秘的。有兩種類型的艾滋病毒。艾滋病毒1型(艾滋病毒1)比艾滋病毒2型(艾滋病毒2型)更為廣泛并導致更嚴重的疾病。HIV-1也比HIV-2多得多。HIV-1分為三大類:M,N和O.引起艾滋病(普遍流行)的病毒屬于M組。M組又分為幾個亞型。您將分析來自HIV-1組M亞型A,B,C,D,F,G,H,J,K的序列。在北美,歐洲和澳大利亞感染人的HIV-1病毒大多來自M組亞型B.艾滋病毒1和艾滋病毒2的所有群體和亞型均在非洲發現。
HIV-1和HIV-2都與在各種非洲靈長類物種中發現的SIV密切相關。這很早就引導研究人員假設艾滋病毒已經從一個或多個非洲靈長類物種跳到人類身上。有人認為,人類和猴子之間的密切接觸是作為寵物飼養的,或者是為了食物而獵殺的,因此SIV可以跳傘。在本教程中,您將使用分子系統發育來確定HIV和SIV的進化關系,從而確定HIV來自哪些非洲靈長類動物。
所有逆轉錄病毒都含有三個大基因:gag,pol和env。gag基因編碼形成病毒顆粒(病毒顆粒)衣殼并執行其他功能的幾種結構蛋白。所述的pol基因編碼幾種酶,包括逆轉錄酶。我們將分析大約2.5千堿基(kb)長的env序列。的ENV基因編碼,其位于病毒粒子的表面上,并與宿主細胞表面受體相互作用的兩種病毒包膜糖蛋白。
您將分析HIV-1,HIV-2和各種SIV?的62個env序列的比對。由于對齊這么多長序列可能需要相當長的計算時間,因此已經進行了對齊。
點擊文件'HIV_Alignment'打開提供的路線。
在查看比對時,請注意,有很多大差距,這是不同物種中快速進化基因比對的特征。
序列以以下格式標記:病毒類型;?其次是SIV序列的靈長類物種的共同名稱,或HIV-1和HIV-2序列的組或亞型;?最后是加入號碼。
該比對包含來自已知感染不同SIV的各種非洲靈長類物種的序列。還有三種來自亞洲的非非洲物種都感染了被圈養的SIV:豬尾獼猴,恒河猴和st尾獼猴。所有這些靈長類物種的SIV均由每幅圖片給出的三字母代碼引用。例如,Sooty mangabey的SIV被稱為SIVSMM,并且隊列或樹中的序列被標記為SIV-SMM。
莫娜猴
Cercopithecus mona mona [denti]
MON [DEN]
德布拉扎的猴
Cercopithecus neglectus
DEB
Tantalus猴子
Chlorocebus tantalus
TAN
Syke的猴子
Cercopithecus albogularis
SYK
大斑點猴
Cercopithecus nictitans
GSN
綠猴
Chlorocebus sabaeus
SAB
胡須髭菊
科cephus
MUS
黑毛猴
Chlorocebus pygerythrus
VER
Grivet?
Chlorocebus aethiops
GRV
L'Hoest的猴子
Cercopithecus lhoest
LST
Sooty?
mangabey Cercocebus atys
SMM
紅帽mangabey?
Cercocebus torquatus
RCM
太陽猴子
Cercopithecus solatus
SUN
Mandrill?
Mandrillu獅身人面像
MND
Drill?
Mandrillus leucophaeus
DRL
豬被盯梢的短尾
猿獼猴nemestrina
MNE
樹樁尾獼猴
Macaca arctoides
STM
羅猴短尾
獼猴獼猴
MAC
常見的黑猩猩
Pan穴居人
CPZ
您將使用Neighbor-Joining?樹木構建方法和Tamura-Nei?模型構建一個系統發育。進化模型描述了每個核苷酸的預期頻率和核苷酸之間的變化率。Tamura-Nei模型假定每個基地具有不同的均衡頻率,并允許轉換和變換以不同的速率發生。它允許兩種類型的轉換(A?G和C?T)具有不同的速率。這在分析HIV序列時很有用,因為HIV表現出由宿主酶(APOBEC3G)引起的超G-to-A突變。您將使用Neighbor-Joining方法,因為這些序列通常不會像時鐘一樣進化。
打開提供的路線。
要使用Tamura-Nei模型構建一個Neighbor-Joining樹,使用引導,單擊??Tree按鈕并選擇Geneious Tree Builder。您應該通過按Reset to Defaults按鈕將任何更改的參數重置為默認值(如果此選項顯示為灰色,則默認設置已被選中)。
對于遺傳距離模型,選擇Tamura-Nei?并為樹構建方法選擇Neighbor-Joining?。將外群設置為“SIV-MON;?莫娜猴;?AY340701“?。這個序列將被用于樹根。
要計算樹的支持值,請使用引導。為此,請勾選Resample樹旁邊的復選框,然后在重新采樣方法旁邊的下拉框中選擇Bootstrap?。使用100個自舉樣本和一個0?的支持閾值。由于您選擇的樣品越多,分析所需的時間越長,因此不要使用超過100個樣品進行此示例分析。如果你想使用提供的樹,你可以通過點擊這里來完成。
樹建筑選項現在應該看起來類似于:
點擊OK?建立樹。
樹構建器完成后,樹文檔將出現在Geneious的文檔表中,并應自動打開。
系統發育樹是進化關系的分支圖。它包含關于一組生物體內進化分歧的順序的信息,并因此包含關于它們之間的關系的信息。它還可以包含有關任何兩個分支事件之間發生的演化變化量的信息。樹上的線稱為分支,這些線的交點稱為節點。節點表示樹中的分支事件。樹的分支模式稱為拓撲。拓撲結構顯示生物體如何相互關聯。
根據屏幕大小和樹的大小,可能無法在樹上顯示所有序列名稱,因此Geneious將只顯示一些序列名稱。要放大樹,請使用樹視圖右側面板中“常規”下的縮放滑塊。要擴展樹的分支之間的距離,請使用擴展滑塊。隨著分支之間的空間量增加,更多的序列名稱將顯示在樹上。
由于此樹是使用Geneious中的對齊創建的,因此該對齊將附加到樹上。點擊“對齊視圖”標簽查看對齊。
對齊中的序列根據樹的拓撲排序。在序列名稱的左側,您可以看到樹形拓撲(如果您使用大型樹,這可能不可見)。選擇“SIV-MON;?莫娜猴;?AY340701“序列中,然后返回到”樹視圖“。這個序列現在也在樹中被選中。
用于構建此對齊和樹的序列具有與它們相關聯的其他元數據(這是在各個序列文檔的“信息”選項卡的“屬性”字段中找到的數據)。這些信息可以顯示在樹的尖端。要在樹的頂端顯示生物體,請從“顯示提示標簽”下的“顯示”旁邊的框中選擇“生物體”。
要顯示生物體和宿主生物體,請按住Ctrl(在Windows上)或Cmd(在Mac上)并選擇“生物體”和“宿主生物體”。現在,宿主生物體和生物體顯示在樹的頂端,用逗號分隔。要在樹上顯示序列名稱,請選擇“名稱”。
正如可以使用不同字體或墨水顏色打印句子而不改變意義一樣,樹木也可以用不同形狀和方向表示。即使外觀發生變化,樹中編碼的信息仍然保持不變。例如,可以通過旋轉分支組來改變樹的外觀。要旋轉分支,請在樹中選擇一個內部節點,然后單擊窗口頂部的“?交換兄弟”?按鈕。這將旋轉該子樹中的分支;?然而,相關程度并沒有通過在樹中旋轉分支來改變。簡單地把兩個名字放在一起,并不意味著任何密切的關系。
試試這個你創建的樹。在包含Grivet猴子和四只Vervet猴子的樹中選擇節點,然后單擊Swap Siblings?按鈕。
這些樣本的順序會在樹上發生變化,但是來自Grivet猴子的樣本與來自四只Vervet猴子的樣本之間的關系并沒有改變。
樹木可能根本沒有根。要將HIV樹視為無根樹,請單擊樹視圖右側面板中“常規”選項下的一個無根視圖。
無根的樹木不會告訴我們關于進化關系的很多內容。我們無法確定哪個節點是祖先,哪些是樹上的后代節點。為了建立祖先 - 后代關系,我們需要確定一個合適的群組,然后在分支上分支樹和樹的其余部分(內部群)。我們可以在構建樹之前指定根來生成有根樹,或者可以在構建樹之后指定根,以將無根樹更改為有根樹。
當你建立HIV和SIV序列的樹時,你指定了一個外群(“SIV-MON; Mona monkey; AY340701”),所以Geneious生成了一棵有根的樹。要將樹視為有根樹,請單擊樹視圖右側面板中“常規”選項下的有根視圖。
根系的系統發育樹可以如上所述水平定向,或垂直定向。這里的時間軸是隱含的,從左到右運行。樹左端的節點是根節點,它代表樹上最老的點。當我們從根節點移動時,我們可以識別祖先到其后代分支的節點。從樹的頂端進行工作,使我們能夠識別近親和遠親。任何兩個有機體的親緣關系的程度是由你在尋找它們共同的祖先所必須去的有根樹上返回多遠而給出的。如果在追溯到A和B的共同祖先時,你通過了A和C的共同祖先,那么你可以說A和C比A和B更相關。
在有根樹上,每個節點及其所有后代節點形成一個分支。這就是我們通常稱之為真正樹上的“分支” - 物理分支和附屬于它的所有小分支和葉子。因為無根樹沒有上述時間軸,所以在這種情況下討論分支是不合適的。
樹的分支的長度可以是任意的(例如,包絡圖),或者可以表示進化變化(phylogram)的量。
在一個曲線圖中,分支的長度與這些分支事件之間發生的變化量成正比。由于您構建的樹是使用距離(1-相似性)度量(即NJ)估計的,因此節點的鄰近度表示它們的總體相似度。
要顯示樹分支的長度,請在樹視圖右側的面板中,從“顯示分支標簽”下的“顯示”旁邊的下拉框中選擇“每個站點的替代”。
在你的樹上,找到“SIV-MAC;?獼猴;?M33262“和”SIV-MNE;?豬尾獼猴;?U79412“,并查看分隔這兩個分類群的分支的長度。現在找到“SIV-MND;?山魈;?AF328295“和”SIV-MND;?山魈;?AF367411“并查看這些分支的長度。分支“SIV-MAC;?獼猴;?M33262“來自”SIV-MNE;?豬尾獼猴;?U79412“短于分隔”SIV-MND“的分支的長度;?山魈;?AF328295“和”SIV-MND;?山魈;?AF367411” 。由此可以得出結論:“SIV-MAC;?獼猴;?M33262“更類似于”SIV-MNE;?豬尾獼猴;?U79412“,而不是”SIV-MND;?山魈;?AF328295“是”SIV-MND;?山魈;?AF367411” 。
如果使用最優性方法(例如MP或ML)來估計樹,則兩個節點的鄰近度反映估計在它們之間發生的字符狀態的演化變化的數量。如果從一棵樹的根部到另一端的有機體A的樹根的總分支長度遠遠大于從另一端的根到有機體B的總分支長度,則可以說A譜系中的進化比在B譜系中更快該樹所基于的字符。
要將樹變換為包絡圖,請在“格式”選項中勾選變換分支框。在Transform?旁邊的下拉框中選擇Cladogram
注意樹的分支長度是如何變化的,并且樹的所有提示都在樹視圖的右側對齊。通過這種轉換,分支的長度是沒有意義的。如果你現在看“SIV-MAC;?獼猴;?M33262“和”SIV-MNE;?豬尾獼猴;?U79412“,然后看看”SIV-MND;?山魈;?AF328295“和”SIV-MND;?山魈;?AF367411“你可以看到分支長度分開”SIV-MAC;?獼猴;?M33262“來自”SIV-MNE;?豬尾獼猴;?U79412“與分隔”SIV-MND“的分支具有相同的長度。山魈;?“來自”SIV-MND的AF328295“;?山魈;?AF367411” 。對于轉換的分支,你不能得出關于如何類似“SIV-MAC;?獼猴;?M33262“是”SIV-MNE;?豬尾獼猴;?U79412“與”SIV-MND“的相似程度進行比較。山魈;?AF328295“是”SIV-MND;?山魈;?AF367411” 。
要將樹轉換回phylogram,請取消選中Transform branches?。要隱藏分支長度,請取消選中“顯示分支標簽”旁邊的框。
除了由樹的拓撲結構和樹的分支長度傳達的信息之外,還可以在樹的節點和/或分支上寫入更多信息。可用于顯示的信息取決于構建樹的方法和使用的選項。通常,支持值將顯示在樹上。
樹木建筑方法生成最能解釋對齊中信息的樹;?然而,這棵樹不太可能解釋所有的對齊變化。并非所有的對齊站點都支持此樹,并且并非樹中的所有分支都必須得到對齊的強力支持。例如,對于快速物種形成事件,在比對中可能沒有足夠的信息來確定一組物種的分支模式,并且樹中的一些分支可能只具有比可能的分支更少的支持。
如果你看看你建造的這棵樹,很難分辨哪支支持強烈支持,哪些不支持。例如,包含“SIV-GSN;?大斑點猴子;?AF468659“和”SIV-GSN;?大斑點猴子;?AF468658“具有與包含”SIV-MND“的分支相同的支持;?山魈;?AF328295“和”SIV-MND;?山魈;?AF367411” ?
要找出對齊支持樹中每個分支的強度,我們可以計算支持值。在樹形建筑選項中,您選擇了“Bootstrap”重采樣方法。樹中分支的引導統計量是分支出現在引導復制樹集合中的百分比。這個百分比范圍從0%(分支沒有出現在任何引導樹中)到100%(分支出現在所有引導樹中)。引導復制樹是通過從對齊中隨機抽樣站點和替換來生成的,以創建一個新的隨機對齊,然后從這個抽樣對齊構建一棵樹。對于指定數量的自舉復制重復此過程(在您的情況下,這是500)。
要在樹上顯示引導值,請勾選顯示分支標簽旁邊的復選框,然后從“顯示”旁邊的下拉框中選擇共識支持(%)。
分支的引導值將顯示在該分支最近的共同祖先節點的左側。
現在引導值顯示在樹上,您可以看到對包含“SIV-GSN;?大斑點猴子;?AF468659“和”SIV-GSN;?大斑點猴子;?AF468658“,但不適用于包含”SIV-MND;?山魈;?AF328295“和”SIV-MND;?山魈;?AF367411” 。
問題1:哪些非洲靈長類動物人類感染HIV-1? > |
問題2:發生了多少次?解釋你的答案。 > |
問題3:你的結論有多少bootstrap支持? > |
問題4:哪些非洲靈長類物種人類感染HIV-2? > |
問題5:這似乎發生了多少次?解釋你的答案。 > |
問題6:你對結論有多少引導支持? > |
問題7:這些亞洲獼猴物種是從哪個非洲靈長類動物中俘獲SIV的? > |
在試圖理解為什么HIV-1大流行開始時,其中一個關鍵問題是“它是什么時候開始的?”從有限的分子序列數據的早期分析到更多近期對更多豐富數據的分析,以下假設已被建議:
通過計算HIV-1流行病毒株何時產生來檢驗這些假設。你可以做到這一點,因為盡管序列往往不會像整個樹上以時鐘一樣的方式進化,但是HIV-1大流行分離株的序列確實似乎以類似時鐘的方式進化。
使用您生成的樹,查看從HIV-1組M序列(亞型AK)到其共同祖先的分支長度。您將需要使用“?常規”?選項卡下的縮放功能來清晰地查看這些分支及其長度。根據需要調整字體。
問題8:計算從分支尖端到M組的共同祖先的平均總和。(要查看樹上的分支長度,請從“Show Branch Labels”下的“Display”旁邊的下拉框中選擇“Substitutions per site” “) > |
問題9:假設HIV-1的替代率每代每個核苷酸位點約有10-5個替換,使用分支長度的平均和來計算從M組序列偏離共同點后已經過去了多少HIV-1世代祖先。 > |
問題10:艾滋病病毒1代持續約2天。這是病毒顆粒感染細胞并產生新的病毒顆粒以準備感染新細胞所需的時間。從這一代開始,計算出多少年前M組序列與共同祖先分離。 > |
問題11:假設平均抽樣年為1990年,大約在哪一年艾滋病毒1型流感大流行發生? > |
問題12:以上有關何時發生大流行病毒序列的假設是否會得到您的結果支持? > |
您已完成本教程。