如何在 NCBI GEO profiles database 中驗証自己的 Gene list

如果手上有一份基因清單,你想問一下別人的實驗中這些基因的表現量如何,要怎麼做呢?最簡單的方法是 NCBI GEO 去看看,看看人家的Expression profiles 是如何?剛被問到這個問題,所以就來試作一下,如果我有一個清單 ( TP53,MYC, CYP1A1, ME1)
gp01
OK, GEO profiles ( http://www.ncbi.nlm.nih.gov/geoprofiles/) 可以提供各別基因的查詢,結果會把資料庫中所有GDS有出現這個基因的data 抓出來。

gp02
不過,現在我們有 4 個基因 x 38575 GDS = 154,300,我想沒有人可以用時間慢慢看,所以我們得利用一些查詢的技巧來把資料整批取回來分析。這次一次查詢四個基因,並且限縮查詢範圍到肝癌.我們在查詢列上打上:
(TP53[Gene Symbol] OR MYC[Gene Symbol] OR CYP1A1[Gene Symbol] OR ME1[Gene Symbol]) AND (hepatoma)
註:更多的查詢技巧請參考GEO說明
gp03
現在四個基因查出來只剩 43 筆了,好多了,但是讀起來還是很痛苦,所以接著你可以按下 [Download profiles data],他會下載一個 profile_data.txt 的檔,你可以用 Excel 打開它。
gp04
四個基因的原始讀值就會依GDS 為單位,排排站好給你看光光,連樣品的分類也列在上面了,看到這裡研究生笑了,你說說NCBI GEO 是不是幹我們這一行的好朋友!

留言