我們輸入的數(shù)據(jù)包含 gene ID 和 vector(單樣本)部分,這里的 gene ID 是一個通用概念,可以是基因、轉錄本、酶或蛋白質(zhì)。這里的 vector 可以是樣本的表達量、倍數(shù)變化, p-value, 組蛋白修飾數(shù)據(jù)等可測量的屬性。下面我們以一個 RNA-seq 差異分析后的數(shù)據(jù)為例,來學習 pathview 的用法。
創(chuàng)新互聯(lián)是專業(yè)的太和網(wǎng)站建設公司,太和接單;提供做網(wǎng)站、網(wǎng)站設計,網(wǎng)頁設計,網(wǎng)站設計,建網(wǎng)站,PHP網(wǎng)站建設等專業(yè)做網(wǎng)站服務;采用PHP框架,可快速的進行太和網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!
在 KEGG PATHWAY Database 查詢,例如查詢小鼠的"Cell Cycle"這條通路:
得到通路 ID 為"04110",物種為"mmu"
我們通過指定 gene.data 和 pathway.id 來觀察我們數(shù)據(jù)里的基因在信號通路“Pathways in cancer”上的表達變化:
相比于原始的 KEGG 圖,我們可以使用 graphviz 產(chǎn)生一個新的布局,并且輸出 PDF 格式的文件:
以下是輸出結果圖
如果我們想要運行的更快一點,并且不介意輸出圖片的大小,我們可以分圖層,用 same.layer = F 將節(jié)點顏色和標簽添加到另一個圖層中,并且原來的 KEGG 基因標簽會變成官方的 gene symbols :
在此基礎上,修改 kegg.native = FALSE ,我們就可以得到一個主圖與圖例分成兩個頁面的 PDF 文件
在原始的 KEGG 視圖中,一個基因節(jié)點可能代表具有相似或者冗余功能的基因/蛋白質(zhì),我們可以將這種包含多個基因的節(jié)點拆分成獨立的節(jié)點,這樣可以更好的從基因層面而不是節(jié)點層面來查看數(shù)據(jù)。同時也可以通過匯總基因數(shù)據(jù)來可視化節(jié)點數(shù)據(jù):
為了畫面有更好的清晰度和可讀性,默認不分裂節(jié)點,也不單獨標記每個成員基因。
代謝途徑中,除了基因節(jié)點還有化合物節(jié)點,我們可以嘗試利用代謝途徑( Propanoate metabolism)整合基因數(shù)據(jù)和化合物數(shù)據(jù)。這里的化合物數(shù)據(jù)包括代謝物、藥物,對它們的測量和它們的屬性。在這里我們?nèi)匀皇褂弥?RNA-seq 差異分析的數(shù)據(jù)作為 gene data,然后,我們生成模擬化合物或代謝組數(shù)據(jù),并加載適當?shù)幕衔?ID 類型以進行演示:
結果如下
pathview 可以集成并將多個樣本或狀態(tài)繪制成一個圖,我們可以使用多個重復樣本模擬化合物數(shù)據(jù):
結果如下,可以看到基因節(jié)點和化合物節(jié)點被分成多份,對應不同的樣本:
我們可以根據(jù)將化合物數(shù)據(jù)分為絕對值大于 5 和小于 5 兩類,構成一組離散型數(shù)據(jù):
結果如下:
Pathview 包中的主函數(shù)是 pathview() ,有著各種參數(shù),是我們用到最多的函數(shù)。在這篇文章中,我們介紹了 pathview()的比較常見的用法,包括包安裝,數(shù)據(jù)準備,以及其他有用的特性。我們也可以使用 pathxiew 的網(wǎng)頁版,地址是 。此外,Pathview 在數(shù)據(jù)整合方面有很強大的功能,包含 4800 個物種,能處理的數(shù)據(jù)屬性和格式包括 連續(xù)/離散數(shù)據(jù)、矩陣/矢量、單個/多個樣本數(shù)據(jù) ,包中還具有強大的 ID 轉換功能,這些都值得我們進一步探索。
生活很好,有你更好
查看GOplot內(nèi)示例數(shù)據(jù)的格式,對自己的數(shù)據(jù)做處理
觀察結論:
觀察自己的兩個數(shù)據(jù)表:
table.legend 設置為T時會顯示表格
本圖中表格和圖例是出圖后剪切拼合而成,沒有用R中的拼圖包
ID轉換用到的是 bitr() 函數(shù),bitr()的使用方法:
org.Hs.eg.db包含有多種gene_name的類型
keytypes() :keytypes(x),查看注釋包中可以使用的類型
columns() :類似于keytypes(),針對org.Hs.eg.db兩個函數(shù)返回值一致
select() :select(x, keys, columns, keytype, ...) eg.
函數(shù)enrichGO()進行GO富集分析,enrichGO()的使用方法:
舉例:
前面我給大家詳細介紹過
?GO簡介及GO富集結果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風格展示結果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個圖別說美觀了,簡直不忍直視。經(jīng)過我的認真研究,發(fā)現(xiàn)跟R版本有關。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關的函數(shù)拿出來認真的研究了一下,終于發(fā)現(xiàn)的癥結所在。
dotplot這個函數(shù),多了個 label_format 參數(shù)
我們來看看這個參數(shù)究竟是干什么用的,看看參數(shù)說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個參數(shù)默認值是30,當標簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調(diào)節(jié)一下這個參數(shù),把他設置成100,讓我們的標簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復原來的容貌。
關于如何使用R做GO和KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
本文名稱:r語言go富集圖 r語言faithful數(shù)據(jù)集
分享路徑:http://www.chinadenli.net/article6/ddcciig.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設、營銷型網(wǎng)站建設、面包屑導航、建站公司、虛擬主機、App開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)