知識資料庫軟體 Ingenuity Pathway Analysis

Ingenuity公司(http://www.ingenuity.com/)系統性的整理科學文獻,將文獻中的研究內容以統一的格式,儲存在資料庫中,並開發 Ingenuity Pathway Analysis (IPA)這個知識資料庫軟體,讓使用者透過方便的介面,可以快速的在龐大的知識海中找到與基因相關的資訊,更進一步的由這些分散的資訊的集合去構建分子調控途徑。


圖片引用自(http://www.ingenuity.com/products/pathways_analysis.html)

太抽象了?!用比較白話的說法吧!ingenuity 公司請了一大堆 ph.D去唸papers,並且請他們將內容作成筆記,例如 A gene會抑制 B gene的表現,C gene 會加速細胞分裂,然後把這些筆記用資料庫存起來,然後,如果你對 A gene 有興趣,透過 IPA 你可以查到 A=>B, A=>D, B=>C, C=>細胞分裂的關連,你也許就可以組合這些資訊,推測A=>B=>C=>細胞分裂這個調控途徑。

除了pathway的預測,IPA也提供了許多附加的功能,例如己知調控途徑,藥物作用及基因功能註解功能,也具備基本的Microarray 分析能力,還有調控途徑繪製的功能。 你可以從這裡<<官方簡介>>找到 更多的資訊,裡面還有詳細的教學文件及影片。既然如此,我並沒有打算幫這一套小眾的軟體寫完全攻略,只是最近在敝單位進這個軟體,順手把玩了一番,又有不少人問這麼昂貴資料庫能作啥,所寫了幾個例子省些口舌,想想既然寫了就放上來大家看看吧!
##ReadMore##目前我比較常用的IPA功能大概是兩個方面 1)由一個功能不明的基因,想知道他有什麼功能。 2)由一群基因(通常是由 microarray 篩出來的),想把他們拼成一個pathway ,並解釋其在功能上的意義。

先來看看從一個未知功能的基因,IPA 可以做些什麼,就以 Lucas 為例吧!來問 Lucas 這個基因是什麼東西?

首先你可以利用簡單的Search功能,來問沒有叫 lucas 的基因資訊,關鍵字搜尋可以從 gene/Chemical, Fucntions/Disease, Pathway/Tox list的角度來搜尋。


可惜並沒有叫Lucas的基因,不過有幾個叫 Luca1,2,3,14,15的基因(luca是德文 lucas的同源字,所以也算啦!),IPA花了不少功夫在解決命名系統泥混亂的問題,由這個表可以決定有沒有選錯基因。

找到目標後,接下來我們來分析HYAL1 (Luca1)的功能。勾選 HYAL1 按ADD pathway 把HYAL1 加到 New pathway中,開始一個新的pathway 的研究。


第一個問題,我們來問HYAL1有沒有什麼己知的功能與他有關。


按下 [Overlay],選取那一方面的知識關連,可以是功能或疾病,也可以是pathway或drug...。


選取之後,左邊就會依顯著程度,把這個基因的有關的功能分類列出。勾選後就會加到pathway中。double click ,他就會告訴你IPA確認這個關連的依據或者pathway 的位置。



第二個問題:如果你想知道是誰調控HYAL1及HAYL1會調控誰,並組合成調控途徑,你可以利用 [Build]的功能。

從單一基因向外延伸:

選取HYAL1,並按下 [Build],選取延伸這個基因的調控途徑的方式[Grow]。 左側的選項讓你能設定Grow的方式。(HYAL1是個冷門的基因,所以還好,如果是熱門的基因,像TP53這類,記得設門檻,以免被巨量資料給掩埋了),設定完[Apply]。


跟這個基因有關連的基因就會被加入這個pathway,例如圖上顯示出,顯示出HYAL1屬於 HYAL集合,並受 VHL, gefitnib 的調控,還會去裂解 hyaluronic acid。每一條線可能是一篇或數篇文獻的研究結果,double click 就會顯示關連的文獻依據。 雖然這些知識零散的可以從文獻海中查出來,經過系統的篩選及圖形化的界面,可以省下大量摸索的時間。

尋找兩基因的關連:
如果這個基因是在 overexpress MYC時發現的,你可能會很想問MYC-HYAL1之間有什麼可能調控途徑。用前面Search的方式找到MYC,再加到這個pathway。然後同時選取MYC 及所有的基因,tools選 [Connection]然後[Apply],接下來,你就可以找到關連。



原來,MYC overexpressed會透過VHL影響HYAL1的表現,進而造成protate cancer cell adhesion的功能變化,這可能是造成轉移的原因,你的paper 標題不就出來了!哈,別太興奮只有標題跟這幾張圖是不能發paper 的,這只是假設,你要有實驗証據才算。

這是一個很幸運的例子,有時候兩基因很難找出這麼簡單的關聯,可能會透過好幾層的才能發現彼此的關連,這時候IPA就顯出的方便了,不然你就要從成千上萬的paper 去撈針了。當然IPA提供的工具不只這樣,還有許多複雜的玩法,威力強大,不過,case by case,要實戰時才能知道如何解析問題。先這樣,下次再來介紹 從Microarray 資料的分析方法。

留言