當前位置:
首頁 > 最新 > 重大進展,同濟大學首次開發AI系統,用於CRISPR技術領域

重大進展,同濟大學首次開發AI系統,用於CRISPR技術領域

iNature

基於CRISPR的基因敲除被廣泛應用於各種細胞類型和生物體。在此系統中,單引導RNA(sgRNA)將Cas9蛋白引導至特定的基因組靶標。識別和切割通過sgRNA內的20個核苷酸(nt)序列與基因組靶標(即靶標上,原始間隔區相鄰基序(PAM)3"端上游【1】)的互補性發生。大量的研究也表明,多重錯配以及DNA或RNA突出可以被容忍,導致非目標基因組位點的切割,稱為脫靶【2】。這種CRISPR-Cas9核酸內切酶系統允許在核苷酸解析度下進行基因組編輯【3,4】,而其有效應用的主要挑戰是事先準確預測sgRNA靶向敲除效率和脫靶(OT)譜。準確的預測將通過最大化其靶向效力(高靈敏度)和最小化其脫靶效應(高特異性)來促進sgRNA的優化設計【1,2,5,6,7】。

人工智慧

已經針對sgRNA靶標識別和功效預測開發了各種sgRNA設計規則和工具。這些方法分為三種類型:(1)基於比對的,其中sgRNA與給定基因組完全通過定位PAM(CasFinder [8]等)進行比對; (2)假設驅動,其中通過考慮基因組環境因子(E-CRISP【9】,CRISPR【6】,CHOPCHOP 【10】,GuideScan 【11】等)的經驗性地對sgRNA敲除效力進行評分; (3)基於學習的,其中通過考慮不同特徵(sgRNA Designer【2】,SSC【5】,sgRNA Scorer【12,13】,CRISPRscan【14】等)從訓練模型預測sgRNA敲除效力。 )。一項基準研究表明,後兩種類型的工具通常比基於比對的工具表現更好,但預測在不同類型的細胞中不能很好地進行比較。

事實證明CRISPR系統會出現脫靶現象。儘管sgRNA引導的Cas9切割在特定位點不一定導致功能性後果(如框內移位突變),但如何準確定量檢測或預測脫靶切割位點仍然是一個重要問題,仍然具有挑戰性。大多數現有的工具使用不同核苷酸錯配的簡單序列比對來搜索脫靶位點。這些基本上是基於假設的方法,它們使用經驗定義的脫靶標準來識別脫靶位點。需要有效的基於學習的全基因組脫靶譜預測。

目前,構建sgRNA功效預測的學習模型面臨幾個障礙:(1)數據異質性問題,需要來自不同細胞類型和實驗平台的數據進行有效整合。 (2)標記的樣品量,即具有已知功效的sgRNA的量相對較小並且在收集實驗上昂貴的數據稀疏性問題 - 標記不充分的數據使得當前學習模型效率低下; (3)脫靶位點預測中的數據不平衡問題 - 在所有可能的核苷酸錯配基因座中,由全基因組脫靶檢測技術識別的真實脫靶切割位點的數目是小的; (4)影響sgRNA功效的先導序列和表觀遺傳學特徵尚不清楚,有待進一步探索。

在這裡,同濟大學劉琦研究組,黃德雙研究組及阿斯利康We iJia合作開發了一套新的方法,簡稱為DeepCRISPR,它基於精心設計的用於模型訓練和預測的混合深度神經網路。 DeepCRISPR具有以下優點:(1)通過考慮不同細胞類型中的表觀遺傳信息,在統一的特徵空間中表示來自不同細胞類型的不同DNA區域,並整合來自不同實驗和細胞類型的數據(2)它從數十億全基因組未標記的sgRNA中學習,自動獲得「母網路」,從而同時為sgRNA on-target和off-target設計生成高級特徵表示。 (3)它應用特定的數據增強技術來生成具有生物學意義標記的新型sgRNA,從而增加sgRNA靶標位點預測中標記的訓練大小。(4)使用標記的sgRNA數據進一步微調母網路,這有助於提高有限標記樣本的預測性能。 (5)將高效的自舉採樣演算法與訓練過程集成在一起,極大地緩解了非目標站點預測中的數據不平衡問題。 (6)最後,它完全自動識別序列和表觀遺傳特徵。

DeepCRISPR可在http://www.deepcrispr.net/上找到。命令行代碼也可從https://github.com/bm2-lab/DeepCRISPR和https://zenodo.org/record/1246320獲取。當前版本的DeepCRISPR專註於人類SpCas9基於傳統的基於NGG的sgRNA設計。它可以很容易地擴展到其他Cas9物種或變種和其他物種。它的目標內和目標外預測性能與可用的最先進的工具進行了比較。

參考文章:

1.Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE. Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation. Nat Biotechnol. 2014; 32:1262–7.

2. Doench JG, Fusi N, Sullender M, Hegde M, Vaimberg EW, Donovan KF, Smith I, Tothova Z, Wilen C, Orchard R. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9. Nat Biotechnol. 2016:34(2):184-91.

3. Cong L, Ran FA, Cox D, Lin S, Barretto R, Habib N, Hsu PD, Wu X, Jiang W, Marraffini LA. Multiplex genome engineering using CRISPR/Cas systems. Science. 2013;339:819–23.

4. Doudna JA, Charpentier E. The new frontier of genome engineering with CRISPR-Cas9. Science. 2014;346:1258096.

5. Xu H, Xiao T, Chen C-H, Li W, Meyer C, Wu Q, Wu D, Cong L, Zhang F, Liu JS. Sequence determinants of improved CRISPR sgRNA design. Genome Res. 2015:25(8):1147-57.

6. Hsu PD, Scott DA, Weinstein JA, Ran FA, Konermann S, Agarwala V, Li Y, Fine EJ, Wu X, Shalem O. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013;31:827–32.

7. Chuai G-h, Wang Q-L, Liu Q. In silico meets in vivo: towards computational CRISPR-based sgRNA design. Trends Biotechnol. 2017;35:12–21.

8. Aach J, Mali P, Church GM. CasFinder: Flexible algorithm for identifying specific Cas9 targets in genomes. bioRxiv. 2014:005074. https://doi.org/10.1101/005074.

9. Heigwer F, Kerr G, Boutros M. E-CRISP: fast CRISPR target site identification. Nat Methods. 2014;11:122–3.

10. Labun K, Montague TG, Gagnon JA, Thyme SB, Valen E. CHOPCHOP v2: a web tool for the next generation of CRISPR genome engineering. Nucleic Acids Res. 2016;44(Issue W1):gkw398.

11. Perez AR, Pritykin Y, Vidigal JA, Chhangawala S, Zamparo L, Leslie CS, Ventura A. GuideScan software for improved single and paired CRISPR guide RNA design. Nat Biotechnol. 2017:35(4):347-9.

12. Chari R, Mali P, Moosburner M, Church GM. Unraveling CRISPR-Cas9 genome engineering parameters via a library-on-library approach. Nat Methods. 2015;12:823–6.

13. Chari R, Yeo NC, Chavez A, Church GM. sgRNA scorer 2.0: a species-independent model to predict CRISPR/Cas9 activity. ACS Synth Biol. 2017:6(5):902-4.

14. Moreno-Mateos MA, Vejnar CE, Beaudoin J-D, Fernandez JP, Mis EK, Khokha MK, Giraldez AJ. CRISPRscan: designing highly efficient sgRNAs for CRISPRCas9 targeting in vivo. Nat Methods. 2015;12:982–8.

內容為【iNature】公眾號原創,歡迎轉載


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 iNature 的精彩文章:

2018年,國際頂級醫學期刊柳葉刀發表重磅綜述,闡述組學中的線粒體醫學
劉清華等研究組在睡眠取得突破性進展

TAG:iNature |