當前位置:
首頁 > 最新 > 怎樣問生物學問題?做開創性研究的過程中遇到哪些瓶頸?怎樣解決?

怎樣問生物學問題?做開創性研究的過程中遇到哪些瓶頸?怎樣解決?

比起文章研究了哪些內容,小哈更喜歡八卦研究過程中的血淚史!~

生信入門路 生物/醫學人的生信啟蒙一文里,小哈請各學科背景的生信人介紹了生信學習、研究經驗。林雪秋博士是其中的一位本科生物背景的美女,小哈這次請她分享一下做生物信息研究過程中的寶貴經驗。一起跟秋秋美女學學:怎樣問生物學問題?在做開創性研究的過程中遇到哪些瓶頸?怎樣解決

括弧()里的文字是小哈的碎碎念

Q:小領域內存在哪個生物學問題沒解決?文章在什麼程度上解決了具體哪個問題?

(怎樣問生物學問題)

A:DNA甲基化修飾一直是備受關注的表觀遺傳修飾,DNA甲基化酶抑製劑是表觀遺傳癌症藥物的一大類。自從2008年Whole-genome bisulfite sequencing (WGBS) 技術發表後,研究人員能夠從全基因組視角,單鹼基高解析度對DNA甲基化在正常發育和腫瘤發生等多種生物學過程中的調控機制進行研究。生物信息學領域的研究人員在近十年已經檢測了各種長的DNA 低甲基化元件並解析這些元件在啟動子,增強子和轉錄因子結合區域的調控功能。比如,在2013年,任兵老師組、李蔚老師組分別定義了超長低甲基區域,DMV和Canyon,並分別在人胚胎幹細胞系和老鼠幹細胞系統初步解析了其調控功能。在2013這一年,我的第一篇小文章也發表了(Bioinformatics,IF=7.3,對於你來說是小文章),李蔚老師希望我接下來能夠更大膽地嘗試一些不確定性的探索

在一次討論中,他提出,現在大家都在定義各種長的DNA元件,我們是不是可以反其道而行之,定義短的區域,從而更好地利用和挖掘WGBS數據的高通量和高分辯率。

但是,對於那些散布在全基因組高度甲基化背景(70%-80%CpG)中的單個低甲基化CpG,沒有有效的計算方法將可信的具功能性的部分從大量隨機分布的噪音中區分出來,從而進一步研究其在各種生物學過程中的調控功能。在這個過程我們花費了比較多的時間,中間也暫停了一段時間。

最後,scUMC這篇文章沒有使用複雜的計算方法,而是從另一個角度出發,解決了這個問題,然後進一步探索了與染色質3D結構相關的調控功能,為表觀遺傳調控提供了新的研究思路。

Q:為了解決這個生物學問題,已有的工具或演算法存在哪些不足?本文開發的演算法或工具具有哪些優勢,才解決了這個問題。

A:以往的DNA甲基化分析方法通常認為鄰近的CpG甲基化水平事高度一致。因此,為了增加分析的可信度,傳統方法通常要求低甲基化區域必須包括至少4個低甲基化CpG。在這個過程中,丟棄了大量的稀疏分布的低甲基化 CpG。另外,儘管WGBS是單鹼基解析度,但是傳統的方法並不能從單鹼基解析度預測甲基化的功能

在嘗試了各種相對複雜的機器學習方法後,我們scUMC這篇文章最終是改變了思維方法,從另一個維度出發,縱向藉助大量高質量WGBS數據(31套人類正常細胞系WGBS數據)中單鹼基低甲基化CpG在多個樣本中的相關性,開發出新的計算方法,檢測出功能性的單鹼基低甲基化CpG。

Q:發現了新的調控元件,從哪些方面入手推測其功能?一定不只看了染色質高級結構這一方面,當初都做過哪些嘗試?

A:相對於功能解析這部分,這個工作的大多嘗試主要是在尋找開發有效的檢測方法上。在功能推測上,我們一開始將這些調控元件跟ENCODE從大量定義出來的調控元件進行相關,發現scUMC跟只有CTCF的元件相關。DNA甲基化關聯CTCF與DNA結合區域已經有很多研究進行闡釋了,所以需要找出更獨特的關注點

當時,我們停下來整理了一下CTCF的各種功能,及其跟DNA甲基化的關係。得益於近年來染色質高級結構的研究發現以及產生的高解析度數據,比如ZNF143因子在DNA環中扮演角色的解析,自然而然有了相關的嘗試和發現,以及進一步分析設計和嘗試。

Q:遇到過哪些瓶頸?如何解決的?

A:這個工作的研究瓶頸主要在於思路的轉換。一開始我們從單個WGBS數據出發,想通過序列和調控元件各種特徵開發出炫酷的演算法解決這個問題,但並沒有得到很好的效果。這個鬱悶的過程持續的時間有一年左右時間。

李蔚老師組裡蘇建忠博士在做另一個工作中,收集了所有公共的WGBS數據並做了相關分析,他的一次組裡彙報激發了這個想法,後續跟導師和師兄的交流促使了這個工作有了質的變化。

因此,有時候策略選擇比炫酷演算法更重要,而策略選擇往往跟你對生物問題的熟悉程度相關。另外,跟導師和同組成員的互動交流也很重要。

蘇建忠博士2017年正式全職加入溫州醫科大學,籌建癌症表觀遺傳學實驗室及生物信息專業。2014年初至2017年在美國貝勒醫學院DanL. Duncan癌症中心李蔚教授實驗室進行博士後研究,主要從事人類癌症表觀調控因子挖掘,調控機制解析的研究,及高通量數據癌症表觀遺傳數據整合和挖掘演算法及軟體開發工作。在國際知名刊物發表了30餘篇同行評議的論文, 其中以第一作者(共同第一作者)或通訊作者,在NatureGenetics, Nature Communication, Genome Biology, Nucleic Acid Research等國際一流雜誌發表研究論文10餘篇,開發演算法軟體及資料庫6個。師兄人很nice,有實力有理想,有興趣加入合作可查看實驗室網站:http://sulab.info,進一步聯繫,點擊左下角「閱讀原文」直達實驗室網站。

想從已發表的DNA甲基化測序、ChIP-seq、eCLIP-seq、ChIA-PET、RNA-seq數據中尋找線索?想用ChIP-seq、ATAC-seq實驗研究感興趣的基因?找嘉因生物吧!從實驗、測序,到多種數據整合分析,為您一站式解決。(點擊文中藍字了解詳情)

嘉因生物公眾號定位:客戶共性問題解答,生信學習資源導航,高通量實驗導購 為您提供高通量實驗-測序-分析-驗證一站式解決方案

Email:marketing@rainbow-genome.com

地址:上海市楊浦區赤峰路65號同濟科技園1號樓611室

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 嘉因生物 的精彩文章:

TAG:嘉因生物 |