如果問基因體未來主將是誰,現在說是NGS大概沒人會反對,擁有單一鹼基的解析度,能定性也能定量,簡直無所不能,真是NGS 即出誰與爭鋒 。在NGS崛起的那一年,我去參加了一個國際會議,各種NGS的應用,百家爭嗚,彷彿所有的基因體問題都可以因NGS迎刃而解。在回程的路途上,國內幾個主要基因體中心學者們,無不興奮的想著如何增強這方面的實力,迎頭趕上。而回國後我們也添購了相關的軟硬體,強化我們對NGS的分析能力。
但一年過去了,我們分析平台並沒有因為巨大運算量而鎖死,而我所聽所見,國內也沒有什麼因為NGS出現,產生了什麼革命性的改變,那時我自卑的想著,果然國內研究實力還是沒法跟得上世界尖端,隔年我又去參加了那個會議,想看看我們又落後了多少,可是很驚訝的是:”不見了!”,去年那些讓人拍案驚奇的新應用不再出現了,這次會議又回到傳統定序的老路子,做些傳統Microarray做的copy numer changes,要不然就是找些奇怪的物種來定序。再沒有充滿驚奇的新應用出現,連去年新應用技術的續集都沒有。
於是Lucas 眉頭一皺,想必這案情並不單純。
##ReadMore##
就像電腦發展一樣,當我們的CPU早就進入了64位元多核心時代,我們真正用的軟體九成還是32位元單執行緒的版本,生命科學也一樣,就像Microarray一樣,1995 發明了microarray,大家也曾如此振奮,但花了十年我們才真得搞清楚microarray的資料要怎麼用,以及他的極限在那裡,缺乏處理數據的經驗及方法,才是阻礙基因體學發展的主要障礙。而NGS的資料量是microarray數百或數千倍,各位覺得我們要多久才能搞清楚NGS。很多人認為NGS,只是因為資料量大,現在運算速度沒跟上罷了,按照摩爾定律,電腦運算量會呈現倍數成長,若NGS資料可以帶來什麼新知,要解開他只是時間的問題,早點投入總是好的呀!這樣積極的態度是正確的,不過那是在問題有解時才成立,就算有了無限的運算的能力,現在的NGS是否真能用來解決你想問的問題嗎?
還記得當人類基明因體定序計劃完成後的所謂後基因體時代,大家說:「 好了,現在我們已經完全把生命之書給印出來了,接下來我們來好好看看這書裡寫了些什麼!」, 這有個更精準的詞叫【功能基因體學】。功能基因體的榮景持續了近十年,可是生命之書郤似乎離破譯之日,仍遙遙無期?我們對基因的功能及交互作用的了解也並沒有革命性的進步。倒是最近NGS出現了,於是大家又想說:「嗯,這書好像不是那麼容易看的懂,不如這樣吧?我們再多印個幾本,也許就看的懂了!」這邏輯似乎怎麼想,都有些奇怪。
上帝用了四個核酸字母ATCG就編寫出生命的藍圖,用了二十八種胺基酸,就創造了千變萬化蛋白質結構,用了四萬個基因完成了人類無比神奇的有機程式。在這個由乘數效應衍生出來的複雜結構,元件本身其實並不是功能的關鍵,元件之間的相對關係才是,這個相對關係是很難從一個靜態的圖譜去了解,無論圖譜的解析度有多好。要了解圖譜上元件相對關係,通常都要利用大量重複的實驗來觀察,例如作Time-lapse, Dosage-depentent, disease progression, 用另一個維度的資訊來協助分析,這就像要從散落一地的電影膠片中,想要拼湊出電影情節,要做的是儘可能的去收集最多的底片,單張底片的解析度當然也很重要,但不是最重要的,夠用就好,四萬點...其實很夠用了。
我並沒有唱衰NGS的意思,他的主將地位仍沒有任何競爭對手可與爭鋒,在某些研究上是非常犀利的工具,例如利用再定序找遺傳疾病的基因缺失,或者miiRNA的分析等,這些例子中,比較沒有長度及樣品數的問題,NGS毫無疑問的是首選,但是如果你現在想要使用NGS做為探索生命現象的工具時,想用來做基因功能分析之類的研究,這種需要大量取樣的研究,在現階段不妨等NGS的成本降下來,定序長度及分析方法都到位了再說,如果你急著想嚐鮮,請容我提醒您幾件事:
但一年過去了,我們分析平台並沒有因為巨大運算量而鎖死,而我所聽所見,國內也沒有什麼因為NGS出現,產生了什麼革命性的改變,那時我自卑的想著,果然國內研究實力還是沒法跟得上世界尖端,隔年我又去參加了那個會議,想看看我們又落後了多少,可是很驚訝的是:”不見了!”,去年那些讓人拍案驚奇的新應用不再出現了,這次會議又回到傳統定序的老路子,做些傳統Microarray做的copy numer changes,要不然就是找些奇怪的物種來定序。再沒有充滿驚奇的新應用出現,連去年新應用技術的續集都沒有。
於是Lucas 眉頭一皺,想必這案情並不單純。
##ReadMore##
就像電腦發展一樣,當我們的CPU早就進入了64位元多核心時代,我們真正用的軟體九成還是32位元單執行緒的版本,生命科學也一樣,就像Microarray一樣,1995 發明了microarray,大家也曾如此振奮,但花了十年我們才真得搞清楚microarray的資料要怎麼用,以及他的極限在那裡,缺乏處理數據的經驗及方法,才是阻礙基因體學發展的主要障礙。而NGS的資料量是microarray數百或數千倍,各位覺得我們要多久才能搞清楚NGS。很多人認為NGS,只是因為資料量大,現在運算速度沒跟上罷了,按照摩爾定律,電腦運算量會呈現倍數成長,若NGS資料可以帶來什麼新知,要解開他只是時間的問題,早點投入總是好的呀!這樣積極的態度是正確的,不過那是在問題有解時才成立,就算有了無限的運算的能力,現在的NGS是否真能用來解決你想問的問題嗎?
還記得當人類基明因體定序計劃完成後的所謂後基因體時代,大家說:「 好了,現在我們已經完全把生命之書給印出來了,接下來我們來好好看看這書裡寫了些什麼!」, 這有個更精準的詞叫【功能基因體學】。功能基因體的榮景持續了近十年,可是生命之書郤似乎離破譯之日,仍遙遙無期?我們對基因的功能及交互作用的了解也並沒有革命性的進步。倒是最近NGS出現了,於是大家又想說:「嗯,這書好像不是那麼容易看的懂,不如這樣吧?我們再多印個幾本,也許就看的懂了!」這邏輯似乎怎麼想,都有些奇怪。
上帝用了四個核酸字母ATCG就編寫出生命的藍圖,用了二十八種胺基酸,就創造了千變萬化蛋白質結構,用了四萬個基因完成了人類無比神奇的有機程式。在這個由乘數效應衍生出來的複雜結構,元件本身其實並不是功能的關鍵,元件之間的相對關係才是,這個相對關係是很難從一個靜態的圖譜去了解,無論圖譜的解析度有多好。要了解圖譜上元件相對關係,通常都要利用大量重複的實驗來觀察,例如作Time-lapse, Dosage-depentent, disease progression, 用另一個維度的資訊來協助分析,這就像要從散落一地的電影膠片中,想要拼湊出電影情節,要做的是儘可能的去收集最多的底片,單張底片的解析度當然也很重要,但不是最重要的,夠用就好,四萬點...其實很夠用了。
我並沒有唱衰NGS的意思,他的主將地位仍沒有任何競爭對手可與爭鋒,在某些研究上是非常犀利的工具,例如利用再定序找遺傳疾病的基因缺失,或者miiRNA的分析等,這些例子中,比較沒有長度及樣品數的問題,NGS毫無疑問的是首選,但是如果你現在想要使用NGS做為探索生命現象的工具時,想用來做基因功能分析之類的研究,這種需要大量取樣的研究,在現階段不妨等NGS的成本降下來,定序長度及分析方法都到位了再說,如果你急著想嚐鮮,請容我提醒您幾件事:
- 現在NGS的成本是Microarray十倍以上,如果你只是拿來NGS當microarray用,用傳統的Array作法,你反而可以有多出十倍以上的取樣數,這是否可以讓你分析上更有利,容易使用統計學的工具,更何況在資料庫中已經累積了上百萬片的Array資料,可以下載回來補你實驗中缺少的環節。
- NGS的資料量極大,大部份桌上型電腦都無法分析,你也不要奢想可以用Excel打開看看,你要是否有心理準備,將有好幾十Gb的資料佔在你的硬碟,你卻連看都看不懂他們。
- NGS技術才剛興起,如何去分析數據,如何去校調分析參數,該使用什麼統計法,都還在討論,你是否考慮過,你現在用的分析結果,有可能建立在錯誤的分析方法上。再者,想想目前我們連數萬個基因的Microaray分析都還搞不定時,數千萬筆資料NGS似乎只會讓我們更頭痛而已。
- 現在NGS的讀取長度仍太短,而長度的問題是目前後續分析最大的障礙,各家NGS平台幾乎都在長度上不斷的推進,差不多一年可以增加一倍的長度,聽說下一代NGS技術已經推進到2500bp了,當長度到達一定時,現在的分析瓶頸就可以突破了,你是否確定要在這個技術未成熟,分析有困難的時刻,投下大筆資金,然後在兩年後發現,用新術技重作一遍,比從現在模糊不清的資料中,更容易得到想知道的答案。
延伸閱讀:
您好,請問您是研究學者還是廠商?
回覆刪除板主回覆:
回覆刪除我目前的狀態是一個想當學者, 郤還沒資格當上的老學徒!
因為投不上 paper 所以先投 Blog. 哈哈!
您的分享讓我受益匪淺!!
回覆刪除感謝~
作者已經移除這則留言。
回覆刪除"...NGS 是值得關注的技術,但Lucas 認為現階段倒還不必急著拋開Array迎向NGS,因為NGS還不是成熟的技術,當NGS的成本開始下降並且跟Microarray 交叉時,才是Microarray 的死線,而當NGS的單一讀取長度超過 1 kb時,才會大放大鳴,那時才是加碼買進的時刻!..."
回覆刪除現在到2012 到加碼買進的時刻了嗎?
"當NGS的成本開始下降並且跟Microarray 交叉時,才是Microarray 的死線" ,還是看您的應用,在許多應用上,現在NGS 己經跟microarray一樣價錢了,例如 miRNA,您可以放手進場了,但是其它用如RNA seq 來取代 Microarray仍不是個好主意,還是建議您 Sample N 比 resolution重要。
刪除I though NGS is NTD 80,000 each, while array is about 21,000 each...
回覆刪除