擴增子圖表解讀4曼哈頓圖:差異分類級別Taxonomy


image

作者: 劉永鑫
日期:2017-6-30
閱讀時長:10min

背景介紹(Introduction)

宏基因組學

宏基因組學目前的主要研究方法包括:16S/ITS/18S擴增子、宏基因組、宏轉錄組和代謝組,其中以擴增子研究最為廣泛。

目的意義

本系列文章將帶領大家結合較新的16S擴增子相關文獻,來理解宏基因組16S擴增子文章中常用圖表種類、圖中包括的基本信息,以及作者想表達的結果。

主要內容

本系列文章內容包括:箱線圖、散點圖、熱圖、曼哈頓圖、維恩圖、三元圖和網絡圖等。

學習思路

  1. 羅列知識點,熟悉專業名詞,弄個臉熟,即使理解不深刻起碼在閱讀中不會有抵觸情緒;
  2. 結合具體文章讀圖,實戰兩三次,基本就是專業人士了。

將來在大家可以很好理解相關文章圖表的基礎上,希望對分析、統計和繪圖相關技術有進一步學習的小伙伴請積極回復並留言吧。如果本系統文章閱讀過萬,想學分析的留言過百。我還將詳細講解擴增子分析、統計和繪圖各步驟的分析實例和源代碼,希望大家多多鼓勵和支持。

聲明:文章的解讀僅代表個人理解和觀點,有不足處,請讀者積極留言批評指正,互相學習,共同進步。

知識點(Method)

曼哈頓圖 Manhattan Plot

image
曼哈頓圖本質上是一個散點圖,用於顯示大量非零大范圍波動數值,最早應用於全基因組關聯分析(GWAS)研究展示高度相關位點。它得名源於樣式與曼哈頓天際線相似(如下圖)。
image
Manhattan plot is a type of scatter plot, usually used to display data with a large number of data-points - many of non-zero amplitude, and with a distribution of higher-magnitude values, for instance in genome-wide association studies (GWAS). It gains its name from the similarity of such a plot to the Manhattan skyline: a profile of skyscrapers towering above the lower level “buildings” which vary around a lower height.
近幾年,在宏基因組領域,尤其是差異OTU結合分類學結果,采用Manhattan plot展示有非常好的效果,倍受推崇。

曼哈頓圖優點

大數據中,即展示數據全貌,又能快速找到目標基因或OTU,同時可知目標的具體位置和分類、顯著程度等信息。絕對高端大氣,而且還有內涵。

數據坐標軸介紹

以上圖GWAS研究結果為例:
- X軸為染色體編號,且每個基因組SNP位點沿染色體序列排列;在16S擴增子或宏基因組中則為OTU按Taxonomy某一級別排序。
- Y軸為該位點相關的統計顯著性Pvalue值,由於pvalue值范圍是從0-1,且越小越好,直接展示非常密集於0附近,很難區分。如何使越近0的顯著數值變大,且而容易區分開,log10變換是非常好的方法,直接把關注的高顯著性(Pvalue趨近零)值高位顯示,遠離整體,目標一目了然。
- 圖中水平線一般為設定的不同顯著性水平閾值,方便讀出每個點的顯著性水平;或只添加一條顯示性閾值,高於則顯著。

曼哈頓圖繪制工具

散點圖,自然還是R語言,ggplot2可以畫的非常漂亮。

看圖實戰(Result)

示例1. 雙曼哈頓圖展示WT和mutant間差異富含OTU分布在那些菌目

Zgadzaj, R., et.al., 2016 .PNAS
這篇文章分析了百脈根根瘤的微生物組成,同時在根瘤缺失突變體條件下發現根和根際微生物組均有較大差異的變化。
image
圖5.A/B 曼哈頓圖展示野生型,突變體根相對於根際土顯著差異的OTU類型
1. 圖中元素解釋
- X軸標簽“OTU… respect to rhizosphere”表示:根際土壤作為背景對照,計算富集的OTU;
- X軸OTU按分類學目水平(order)字母順序排列顯示,由於數量太多,不顯示OTU編號標簽反而更美觀;
- Y軸為-log10(Pvalue);將pvalue轉換為越顯著越大,便於觀察;
- 主圖區的每個圓點或圈代表1個OTU,大小代表其相對豐度;其中存在顯著富集OTU的目中所有OTU用彩色實心圓點顯示,並添加灰度背景,且該目的名稱標注於圖頂部;目中內無顯著富集OTU的目為空心灰點,且背景為白色。
2. 圖表結果:兩個曼哈頓圖展示WT和mutant間差異富含OTU分布在那些菌目;而且與野生型相比,在突變體中許多顯著富集的菌目消失;
3. 經驗和技巧:單曼哈頓圖顯示顯著富集的OTU已經信息非常豐度;采用曼哈頓圖展示兩中組差異的OTU,讓讀者自己去比較差異,反而更突出結果的顯著差別。分類學注釋級別選擇目,找到了一些差別的類,要保證這些類即不能太多,也不能太少,才便於傳遞給讀者工作即全面、又細致的印像。

附圖注原文:
Fig. 5. Manhattan plots showing root-enriched OTUs in WT (A) or in the mutants (B) with respect to rhizosphere and rhizosphere-enriched OTUs in WT (C) or in the mutants (D) with respect to root. OTUs that are significantly enriched (also with respect to soil) are depicted as full circles. The dashed line corresponds to the false discovery rate-corrected P value threshold of significance (α = 0.05). The color of each dot represents the different taxonomic affiliation of the OTUs (order level), and the size corresponds to their RAs in the respective samples [WT root samples (A), mutant root samples (B), WT rhizosphere samples (C), and mutant rhizosphere samples (D)]. Gray boxes are used to denote the different taxonomic groups (order level).

示例2

image
這是我自己畫的一個樣式,對上圖的樣式做了一些改進,展示一個基因敲除突變體(KO/mutant)與野生型(WT)細菌組的比較;
1. 圖中元素解釋
- X軸為OTU,按分類學門水平字母排序;
- Y軸兩組比較的Pvalue值,取loge(P),即自然對數轉換;
- 圖中點的大小代表該OTU的相對豐度,取log2(CPM)對數,即2的對數;CPM為count per million的縮寫,和RPM類似,都是百萬分數;
- 圖中點顏色代表分類學門類型,便於從門水平找規律;
- 圖中點的形狀標注了其變化的類型,是上調enriched(正實心三角),還是下調depleted(倒空心三角),還是沒有顯著差異變化nosig(實心圓點);
2. 圖表結果:展示了KO突變體基因型相較WT有較明顯的細菌組變化,尤其是放線菌門上調較多,變型菌門上調和下調都很多,但上調的更顯著;
3. 圖表經驗:從門水平先看整體規律,再一步步往綱、目、科、屬去找規律的具體細節;用形狀區分上調或下調,讓結果更清楚。

Reference

  1. https://en.wikipedia.org/wiki/Manhattan_plot
  2. Zgadzaj, R., Garrido-Oter, R., Jensen, D.B., Koprivova, A., Schulze-Lefert, P. and Radutoiu, S., 2016. Root nodule symbiosis in Lotus japonicus drives the establishment of distinctive rhizosphere, root, and nodule bacterial communities. Proceedings of the National Academy of Sciences, 113(49), pp.E7996-E8005.

想了解更多宏基因組、16S文獻閱讀和分析相關文章,快關注“宏基因組”公眾號,干貨第一時間推送。
image

系統學習生物信息,快關注“生信寶典”,那里有幾千志同道合的小伙伴一起學習。
image


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com