生物信息學(xué)服務(wù)
非約束排序(PCoA/NMDS等)
【添加時(shí)間:2016-09-12 09:24:27】【來源:】【作者:dggadmin】
        非約束排序是尋求潛在的或在間接的環(huán)境梯度來解釋物種數(shù)據(jù)的變化,例如PCA、CA、DCA、PCoA、NMDS等,可以直觀的顯示不同樣品(組)之間的微生物群落差異。

        主成分分析 (principal component analysis, PCA): 基于特征向量的排序方法,分析對(duì)象是原始的定量數(shù)據(jù),排序圖展示樣方之間的歐氏距離。

        主坐標(biāo)分析 (principal coordinates analysis, PCoA): 通過一系列的特征值和特征向量進(jìn)行排序后,選擇主要排在前幾位的特征值。分析對(duì)象為任意類型的距離矩陣,因此可靈活選擇關(guān)聯(lián)測度。PCoA是將聚類分析與主成分分析方法結(jié)合起來,用較少的主坐標(biāo)對(duì)分類單元進(jìn)行有效地排序,并使損失的信息最小。

        非度量多維尺度分析 (nonmetric multidimensional scaling, NMDS): 嘗試在預(yù)先設(shè)定數(shù)量的排序軸去排序?qū)ο?,目?biāo)是保持這些對(duì)象排位關(guān)系不變,反映對(duì)象之間的順序關(guān)系。分析對(duì)象為任意類型的距離矩陣。該方法不基于特征向量排序,不以排序軸承載更多的變差為目的,對(duì)距離缺失的數(shù)據(jù)有優(yōu)勢。

        在16S rRNA基因擴(kuò)增子測序分析中,普遍使用基于Unifrac距離的PCoA或NMDS分析。Unifrac距離同時(shí)考慮了物種組成差異和系統(tǒng)發(fā)育關(guān)系。Bray-Curtis距離則更適用于不能構(gòu)建系統(tǒng)發(fā)育樹的情況(例如真菌ITS測序、宏基因組分析)。
        此外,Unweighted (非加權(quán))距離只考慮物種是否存在,Weighted (加權(quán))距離考慮了物種豐度的差異。


\
圖1 基于Weighted Unifrac距離的PCoA主坐標(biāo)分析
        圖中的點(diǎn)代表樣本,點(diǎn)與點(diǎn)之間的距離表示差異程度,括號(hào)里的百分比表示該軸能夠解釋的群落差異比例。建議不分組時(shí),樣本數(shù)量不少于10個(gè);多組樣本時(shí),每組樣本數(shù)量不少于5個(gè)。

\
圖2 基于Weighted Unifrac距離的NMDS分析
       注:圖2與圖1是針對(duì)相同數(shù)據(jù)繪制的。



上一篇:Alpha多樣性分析
下一篇:約束排序(RDA/CCA等)