當前位置:
首頁 > 健康 > 基因編輯技術的原理及其在癌症研究中的應用

基因編輯技術的原理及其在癌症研究中的應用

基因編輯技術的原理及其在癌症研究中的應用

基因編輯技術,是指對DNA核苷酸序列進行刪除和插入等操作,換句話說,基因編輯技術使得人們可以依靠自己的意願改寫DNA這本由脫氧核苷酸寫而成的生命之書。然而長期以來,對DNA的編輯只能通過物理和化學誘變、同源重組等方式來對DNA進行編輯。然而這些方法要麼編輯位置隨機,要麼需要花費大量人力物力進行操作。因此,能夠方便而精確的對DNA和核苷酸序列進行編輯,是科研工作者們長期以來的夢想。CRISPR-Cas9系統的誕生和成熟標誌這這一夢想逐漸變為現實。此外不僅僅在科研界,在諸如醫療、農業、畜牧業等研究中,這一技術也顯現除了巨大的應用前景。本期邀復旦大學王永明教授、謝一方博士介紹基因編輯技術的分類、CRISPR/Cas9技術的應用,著重介紹其在癌症領域的應用和發展狀況,使讀者對該技術有一個總體的把握。

基因編輯技術的原理及其在癌症研究中的應用

基因編輯技術的原理及其在癌症研究中的應用

專家簡介—王永明

復旦大學生命科學學院研究員,博士生導師,斯坦福大學博士後,國家青年千人入選者,主要從事基因編輯技術研發和心肌再生研究。2005-2010年在德國馬克斯-德爾布呂克分子醫學中心(MDC)做博士生研究,並獲柏林自由大學博士學位;2010-2013年在斯坦福大學醫學院從事博士後研究。2012年率先將基因編輯技術引入心血管領域,實現對心肌細胞的分子影像學分析,2014年通過基因編輯技術率先製作出了長QT綜合征的幹細胞模型。回國後,利用附著體載體表達Cas9和gRNA,開發出了高效的附著體CRISPR技術。近5年以第一或通信作者身份在Nucleic Acids Research, Journal of the American College of Cardiology, Scientific Reports和PloS Genetics等雜誌上發表多篇論文。

基因編輯技術的原理及其在癌症研究中的應用

【摘要】基因編輯技術能夠對基因組序列進行準確、穩定的遺傳改造,給生命科學和臨床治療帶來革命性的變革。CRISPR/Cas9技術是基因編輯領域一個突破性進展,它操作簡單、編輯效率高,極大地擴展了科學家對基因的操控能力。本文中,筆者將介紹基因編輯技術的分類、CRISPR/Cas9技術的應用(基因敲除、基因敲入、CRISPR/Cas9導入細胞的方法、提高CRISPR/Cas9特異性和調控CRISPR/Cas9系統)、CRISPR/cas9系統的其他應用(鹼基轉換、表觀遺傳調控、內源基因的轉錄調控及全基因組範圍內的遺傳篩選)及CRISPR/Cas9系統在癌症研究中的應用(建立癌症的小鼠模型、建立染色體重排的癌症模型、高通量篩查與腫瘤細胞轉移相關的基因、癌症治療),著重介紹其在癌症領域的應用和發展狀況,使讀者對該技術有一個總體的把握。

【關鍵詞】基因編輯;CRISPR/Cas9;癌症

利用細胞系或者模式生物研究基因功能時,經常需要在基因上引入突變。真核生物基因組含有數十億個鹼基對,在基因編輯技術出現之前,定點改變某個位置的鹼基序列無疑是一個巨大的挑戰。美國遺傳學家Capecchi等[1]通過基因打靶技術首次實現了對基因組的定點修飾,他們將精心設計的外源基因載體導入到小鼠胚胎幹細胞中,通過同源重組定點整合到基因組中。這種方法只適用於小鼠的胚胎幹細胞,在其他類型的細胞中重組頻率非常低[2]。Rouet等[3]發現在要修飾的DNA位點產生一個DNA雙鏈斷裂(double-strand break,DSB)可以提高同源重組效率。至此,科學家開始研究在基因組定點產生DNA雙鏈斷裂的方法,最終發明了基因編輯(genome-editing)技術。基因編輯技術是一種通過程序化的人工核酸酶對基因組DNA序列進行改造的遺傳操作技術,它給生命科學研究領域帶來了革命性的變化。人工核酸內切酶能夠識別並切斷靶DNA序列,產生DSB,細胞主要通過兩種修復途徑修復DSB,分別是非同源末端連接(non-homologous end joining, NHEJ)和同源重組(homologous recombination, HR)[4]。通過NHEJ修復DSB時,參與修復的蛋白經常會在DNA末端插入或刪除幾個鹼基(indel),然後將DNA連接到一起;修復後的基因由於含有突變而導致功能喪失,稱為基因敲除(knock-out)。通過HR修復DSB時,需要在轉染細胞時提供一個與靶DNA兩側同源的供體模板(雙鏈質粒或是單鏈DNA)[5-6],供體模板上攜帶想要引入的突變或者轉基因,修復系統會將供體模板的信息拷貝到DSB處;這種方法可以在基因組中精確地引入點突變,或者插入目的基因,稱為基因敲入(knock-in)(圖1)。需要強調的是NHEJ和HR競爭修復DSB,而NHEJ的效率遠遠高於HR,發生HR的細胞一般需要通過標記基因才能篩選出來,筆者曾經通過HR和隨後的篩選方法將轉基因高效的整合到了人基因組的AAVS1「安全港」位點[7-8]。本文著重介紹CRISPR/Cas9技術在癌症領域的應用和發展狀況,使科研工作者更好的應用該技術。

1

基因編輯技術的分類

基因編輯技術主要分為3類,分別是鋅指核酸酶(zinc-finger nuclease, ZFN)技術、轉錄激活因子樣效應物核酸酶 (transcription activator-like effector nuclease, TALEN)技術以及近幾年發展迅猛的CRISPR(clustered regularly interspaced short palindromic repeats,CRISPR)/Cas9技術。在本綜述中,筆者對ZFN和TALEN技術只做簡單的介紹,對CRISPR/Cas9技術做詳細的介紹。

基因編輯技術的原理及其在癌症研究中的應用

圖1 基因編輯技術原理

1.1 ZFN技術原理

最早出現的基因編輯技術是ZFN技術,ZFN由鋅指蛋白(zinc finger protein,ZFP)和FokI核酸內切酶兩部分構成。鋅指蛋白是真核生物中最豐富的一類DNA識別蛋白[9],Pavletich等[10]解析了ZFP中DNA結合結構域,為設計新的DNA序列特異性結合蛋白提供了重要的基礎。Sugisaki等[11]在細菌中發現了FokI核酸內切酶,Li等[12]發現FokI由DNA結合結構域和DNA切割結構域兩部分組成。Chandrasegaran等[13]用ZFP代替FokI核酸酶的DNA結合結構域,新產生的核酸酶稱為ZFN,它可以切割特異性的靶位點。ZFN 的DNA 識別結構域是由3~4個 Cys2-His2鋅指蛋白串聯組成,每個鋅指蛋白識別一個特異的三聯體鹼基。多個鋅指蛋白串聯起來形成一個鋅指蛋白組,識別一段在基因組中特異的鹼基序列(9~12 bp),一個鋅指蛋白組和一個FokI核酸酶相連構成一個ZFN。FokI核酸酶在二聚體狀態下才有切割活性[14],因此需要在恰當的位置(識別位點相距5~7 bp)設計兩個單體的ZFN才能切割DNA(圖2)[15]。ZFN技術的優點是鋅指蛋白小,編碼一對ZFN只需要大約2 000 bp,這樣的蛋白容易通過AAV病毒載體導入體內進行基因治療(表1)。但是ZFN技術存在很明顯的缺點,它需要一個很大的鋅指蛋白庫才能做到靶向不同的基因序列,將鋅指蛋白連接在一起時,它們之間會相互干擾,影響靶向結合DNA的特異性,導致ZFN容易脫靶。因此,要想製備出高效特異的ZFN,需要大量的篩選工作,極大地阻礙了它的推廣應用。設計ZFN的方法請參考OPEN和CoDA法[16-17]

基因編輯技術的原理及其在癌症研究中的應用

基因編輯技術的原理及其在癌症研究中的應用

圖2 ZFN、TALEN和CRISPR/Cas9結構的示意圖

1.2 TALEN技術原理

2007年,Moscou等[18]和Boch等[19]發現了植物黃單胞菌(xanthomonas sp)通過轉錄激活樣效應因子(transcription activator-like effector,TALE)促進自身增殖的機制。黃單胞菌通過分泌系統將TALE注入到植物細胞中,TALE能夠靶向到啟動子區域的特異DNA序列增強基因表達,這種表達反過來會促進細菌的增殖。該兩團隊破譯了TALE識別特異DNA序列的機制,TALE依靠34個氨基酸的重複序列識別DNA序列;其中第12、13位點氨基酸為可變序列,且與鹼基A、G、C和T有恆定的對應關係,即NG識別T、HD識別C、NI識別A、NN識別G。把這4種TALE模塊組裝起來就可以識別特異的基因組DNA序列。Cermak等[20]把TALE模塊和FokI核酸酶的切割結構域連接起來,組裝成新的核酸酶叫作TALEN(圖3)。TALEN的組裝相對簡單,活性和特異性較好(表1)。設計TALEN推薦使用Daniel Voytas實驗室發明的Golden Gate組裝方法[20]。這種方法比較簡單,一般的分子生物學實驗室均能組裝,大約需要1周的時間,用到的組裝質粒可以從Addgene上獲得。

基因編輯技術的原理及其在癌症研究中的應用

A: epiCRISPR質粒流程圖;

B: epiCRISPR系統基因編輯圖

圖3 epiCRISPR質粒的結構及其工作流程

1.3 CRISPR/Cas9技術原理

CRISPR的全稱是規律成簇間隔短迴文重複(clustered regularly interspaced short palindromic repeats)。CRISPR系統分為3類(I~III),I 和III 類的CRISPR系統在細菌和古生菌中均有發現,含有多個Cas蛋白;II類CRISPR系統僅在細菌中存在,只包括一個Cas蛋白[21]。1987年日本大阪大學的科學家[22]在研究大腸桿菌中的鹼性磷酸酶基因時,發現該基因下游存在29 bp的簡單重複序列,這些重複序列被32 nt的間隔序列(protospacer)分開。接下來的十多年裡,在越來越多的微生物和古生菌中發現了類似的重複結構。2002年 Jansen等[23]把這種間隔重複序列命名為CRISPR,2007年才證明CRISPR系統是細菌的一種適應性免疫系統[24]

II類CRISPR系統組成最簡單,除了一個Cas蛋白和crRNA(重複序列+間隔序列)外,還包括一個非編碼RNA,被稱為tracrRNA,它協助細菌將串聯的crRNA加工成單個的crRNA,並和crRNA的重複序列互補配對後形成嚮導RNA,引導Cas核酸酶靶向切割外源DNA [25-26]。有研究[26]顯示,釀膿鏈球菌中tracrRNA、crRNA和SpCas9蛋白(釀膿鏈球菌中的Cas稱為SpCas9)3個元件在體外可以靶向切割DNA ,為實現基因編輯邁出了關鍵的一步。相繼有研究團隊 [27-28]將釀膿鏈球菌的CRISPR/Cas9系統開發成為一種可以在哺乳動物細胞中進行基因編輯的工具,成為目前應用最廣泛的基因編輯技術。CRISPR/Cas9已經實現了對於多個物種以及細胞系的基因編輯,如細菌、酵母、人類的癌細胞系和胚胎幹細胞系、果蠅、斑馬魚、青蛙、小鼠、大鼠、兔、煙草、水稻等[27, 29-38]

CRISPR/Cas9系統作為基因編輯工具時,crRNA和tracrRNA被融合為一條嚮導RNA(single-guide RNA,sgRNA)表達,所以該系統只包含sgRNA和Cas9核酸內切酶兩個元件[26]。sgRNA 5′端20 bp序列是與靶序列互補配對的序列,如果編輯某個靶位點,只需要改變這20 bp的序列就可以實現。sgRNA一般是通過人的RNA聚合酶Ⅲ啟動子U6起始表達的,這個啟動子起始轉錄的第一鹼基必須是G。如果sgRNA序列第一個鹼基不是G,就需要在序列前加上一個G,或者把sgRNA的第一個鹼基替換成G,這樣才能被U6啟動子表達。這樣表達的sgRNA與靶序列之間會有一個鹼基不配對,但是不會影響編輯效率[27-28]。CRISPR/Cas9技術的一個優點是可以在一個細胞中表達多個sgRNA,同時編輯多個靶位點,這是ZFN和TALEN無法企及的(表1)。有報道[39-40]稱CRISPR/Cas9系統在小鼠和斑馬魚中可以同時編輯5個基因,在大鼠細胞中可以同時編輯3個基因。

CRISPR/Cas9系統識別的位點受DNA序列的限制,不是所有的位點都可以被識別。SpCas9識別的靶序列後面必須是NGG序列,被稱為PAM (protospacer-adjacent motif)序列(表2),因此,SpCas9識別的序列可以寫成N20NGG,其中N20是與sgRNA互補配對的序列,NGG是PAM序列。在人基因組中,平均每8~12bp就有一個GG序列[41]。Cas蛋白不同,需要的PAM序列也不同[42-47]。如果需要精確切割某個基因組位點,可以根據基因組序列選用合適的CRISPR/Cas系統。目前被開發成基因編輯工具的CRISPR/Cas系統及其PAM序列見表2。

2

CRISPR/Cas9技術的應用

2.1 基因敲除

基因編輯在利用CRISPR/Cas9做基因敲除時,sgRNA的選擇至關重要。要破壞一個基因的功能,理想的情況是在基因編碼重要功能域的位點設計sgRNA,但是大多數情況下研究者不知道此段基因編碼了哪些重要功能域。在編碼區的最前端接近起始密碼子ATG的區域設計sgRNA進行編輯,移碼突變會造成整個基因無法表達。但是有些情況下,這個基因會從後面的ATG開始表達,表達出來的蛋白依然能夠行使功能。如果編輯的位點過於靠近編碼區的後端,前面很長的蛋白會被表達,可能依然保留了功能。Doench等[48]通過對多個基因分析發現,在編碼區起始位點長度的5%~65%區域內設計sgRNA可以最大可能的敲除基因。有些基因包括多個轉錄本,要把sgRNA設計在它們共同的區域,才能敲除所有的轉錄本,注意不要把sgRNA設計在基因的內含子區,要根據編碼區進行設計。編碼區是多個外顯子拼接在一起的序列,sgRNA不要跨在兩個外顯子上,因為研究者最終編輯的是基因組DNA,兩個外顯子在基因組上是被內含子分開的,跨在兩個外顯子的sgRNA序列在基因組中是不存在的。

基因編輯技術的原理及其在癌症研究中的應用

確定好編輯的區域後,在所選區域會有很多靶位點可以選擇,需要選擇一個最優的位點設計sgRNA。sgRNA序列與編輯的效率和特異性緊密相關[49]。科學家通過大量的數據分析,已經找到了sgRNA序列與編輯效率之間的關係,為設計高活性的sgRNA提供了依據[48]。除了sgRNA的活性問題外,還需要考慮脫靶問題。脫靶切割是基因編輯領域共同關心的一個問題,它會在基因組中引入額外的突變,影響實驗結果的可靠性。sgRNA的序列與脫靶緊密相關,如果在基因組中存在與sgRNA序列相似的序列,這些位點可能也會被編輯。有研究[50-53]顯示,靠近PAM序列的8 ~12 bp對於Cas9識別至關重要,這一區域的序列被稱之為種子序列。種子序列與sgRNA序列不匹配會嚴重影響Cas9核酸酶的切割;相比之下,5′端也就是遠離PAM的序列具有更強的錯配耐受性,即使這一區域有兩三個鹼基不匹配,sgRNA也有可能引導cas9核酸酶進行切割。此外,PAM序列變成NAG,Cas9也會對其進行切割,因此在檢測脫靶的時候,PAM序列為NAG的相似序列也需要被考慮成潛在的脫靶序列[30, 53]

脫靶問題已經成為做基因編輯時必須要考慮的問題。CRISPR/Cas9技術剛出現的時候,有課題組[49]為了研究改進特異性的方法,選擇了特異性差的sgRNA研究,這就造成了CRISPR/Cas9脫靶嚴重的印象。而後來的研究結果[54-55]表明,如果sgRNA序列特異,脫靶可能性是極其低的,甚至檢測不到。基因組中只有2%的序列是編碼區,即使脫靶,切割到這些區域的可能性也是極其低的,切割到這些區域而且又恰好影響到實驗結果的可能性就更低了,所以大多數基因編輯領域的學者認為做基礎研究時不用過分擔心脫靶的問題。將來如果把CRISPR/Cas9技術用於臨床治療,脫靶問題還是需要慎重考慮的。現在有很多軟體可以在線設計sgRNA,筆者推薦使用Doench等[48]設計的網站(http://portals.broadinstitute.org/gpp/public/analysis-tools/sgrna-design),這個網站綜合考慮了sgRNA的活性和特異性,使用人員可以提供DNA序列進行設計,也可以輸入基因ID進行設計,非常方便。

2.2 基因敲入

基因敲入是經常需要用到的一項重要技術,比如要研究患者攜帶的基因突變是否具有致病性,就需要將這個點突變引入到細胞或動物中製作模型;要研究一個基因在哪個組織中表達,就需要在這個基因上面連上GFP報告基因。在做基因敲入時,需要將一個與編輯位點同源的DNA供體和CRISPR/Cas9共同轉染到細胞中,細胞內的修復系統修復DNA雙鏈斷裂時,會將供體上攜帶的點突變或者轉基因拷貝到雙鏈斷裂處。這個供體模板可以是質粒DNA,也可以是單鏈的Oligo DNA。利用質粒DNA做供體時,敲入的效率比較低,需要在供體上加入標記基因,標記基因與點突變一同被引入到基因組上,通過藥物篩選或者流式分選的方法將敲入的細胞篩選出來,這樣效率就大大提高了[7]。編輯完成後,標記基因需要移除以免影響基因表達。移除的方法是設計時在標記基因的兩端加上LoxP位點,在細胞中瞬時表達Cre重組酶就可以去除標記基因了。去除後,基因組中會留下一個34 bp的LoxP位點,所以設計的時候需要把標記基因及LoxP位點放在內含子區。因為轉染效率的問題,不是所有的細胞都會去除標記基因。所以一般都用嘌呤黴素(puromycin)抗性基因和單純皰疹病毒胸苷激酶(HSV-tk)融合的基因作為標記基因,嘌呤黴素抗性基因用作正向篩選,HSV-tk在去除標記基因時用作負向篩選,加上更昔洛韋就可以殺死含有標記基因的細胞。用質粒DNA作為供體的優點是可以將大片段的轉基因敲入到細胞中,經過篩選後效率很高,缺點是構建載體比較麻煩,而且需要兩步(敲入和去除標記基因)才能得到細胞系。

單鏈DNA也可以作為基因敲入的供體。單鏈DNA供體在DSB兩邊的同源臂長度40~50 bp為佳。利用單鏈DNA可以把點突變和短的DNA序列整合到基因組中,但它無法將較大的基因敲入到基因組,因為目前Oligo合成的長度一般少於150 bp。單鏈DNA比較短,容易大量地轉入細胞中,在一些實驗中取得了較高的敲入效率,最高可達60%[57]。單鏈DNA合成成本低,速度快,編輯完成後不需要去除標記基因,但這種方法也有明顯的局限,突變的敲入效率受CRISPR/Cas9切割位點的影響,單鏈DNA上的突變位點與切割位點小於10 bp才能實現有效的敲入[58],很多情況下找不到理想的切割位點。敲入效率也受細胞類型的影響,很多情況下效率太低難以篩到陽性克隆。有研究[59-60]表明,加入DNA ligase IV的抑製劑Scr7可以提高了同源重組的效率,DNA ligase IV是NHEJ途徑的關鍵酶,抑制了NHEJ途徑就會促進HR途徑,但每種細胞對Scr7濃度的耐受程度不同,提高的效率也相差很大,從二三倍至十幾倍,需要花時間摸索最佳的條件,所以很少有人使用。另外,NHEJ途徑被Scr7抑制後是否會增加基因組的突變需要進一步的研究。無論用單鏈DNA還是用質粒DNA做基因敲入時,都需要在供體上CRISPR/Cas9識別的位置加上幾個同義的鹼基突變,以免敲入成功後又被CRISPR/Cas9破壞了。

除了上述兩種常用的基因敲入方法,還有其他幾種方法值得借鑒。有研究[61]發現,通過NHEJ的方法可以有效地將外源基因定點整合到基因組。利用NHEJ途徑插入外源基因時,需要在供體質粒上引入編輯位點,基因組和供體質粒同時被切斷,供體質粒DNA會被連接到基因組上,但是這種連接有正反兩個方向。細胞中除了經常提及的NHEJ和HR修復途徑,還有一個微同源性末端連接(MMEJ)修復途徑,它依靠5~25 bp 的同源序列將DNA兩端融合在一起。有研究者[62]在供體質粒上設計了兩個20 bp的同源臂,基因編輯技術同時切斷基因組DNA和供體質粒,供體質粒會通過MMEJ定向整合到基因組。但是這兩種方法效率都不高,最近有兩個課題組[63-64]發現,把同源臂增加到600~800 bp可以顯著提高敲入效率。隨著研究的深入,更多的新方法會被發明出來。

2.3 CRISPR/Cas9導入細胞

CRISPR/Cas9可以對體外培養的細胞系或者原代細胞進行編輯,也可以對受精卵和體內細胞進行編輯。編輯不同的對象需要採取不同的方法將CRISPR/Cas9導入到細胞中。編輯體外培養的細胞時,有很多種方法可以將CRISPR/Cas9質粒導入到細胞中,常用的方法是Lipofactamine、PEI和電轉的方法[65]。Lipofactamine和PEI方法簡單廉價,是首選方法;電轉成本比較貴,但是效率高。這幾種方法都是瞬時轉染,細胞培養1周後質粒就會丟失。某些類型的細胞只有用病毒的方法才能轉進去,常用的病毒載體包括逆轉錄病毒(retrovirus)、慢病毒(lentivirus)、腺病毒(adenovirus)和腺相關病毒(adeno-associated virus, AAV) [66]。其中逆轉錄病毒和慢病毒會整合到基因組,可以長期表達轉基因,優點是可以提高編輯效率,缺點是整合過程中可能會導致額外的基因突變,長期表達CRISPR/Cas9也會增加脫靶的效率。AAV主要以非整合形式表達轉基因,但是會有少量整合的情況發生[67]。AAV載體在機體中產生的免疫排斥小,是基因治療的理想載體。有研究[68]發現,一個較小的Cas9蛋白可以包裝在AAV病毒中,這給基於CRISPR/Cas9的基因治療帶來了曙光。腺病毒不會整合到基因組,對某些類型的細胞轉染效率較高。每種方法都有各自的優缺點,需要研究人員根據實驗需要選擇合適的方法。

建立單克隆細胞系一般都採用瞬時表達sgRNA和Cas9的方法,質粒導入到細胞中2~4 d後,將細胞稀釋成單細胞重新種到培養皿中培養,形成克隆後鑒定編輯是否發生了。有的細胞不能形成克隆,需要將單細胞種到96孔板中培養。有些細胞轉染效率低,需要在質粒上同時表達GFP,通過流式細胞儀分選出轉染成功的細胞會提高編輯效率。最常用的CRISPR/Cas9質粒比如PX458(同時表達GFP)、PX459(同時表達puromycin抗性基因)等,均可以從Addgene 公司購買[41]

利用CRISPR/Cas9敲除基因時,瞬時表達的方法編輯時間短,編輯效率一般為3%~30%[49];利用病毒的方法可以長期提高編輯效率,但是病毒整合到基因組上就無法去除了。理想的方法是編輯時間可控,編輯後細胞不再含有CRISPR/Cas9等外源基因。本課題組發明了高效的基因編輯技術,筆者利用附著體載體表達Cas9、gRNA和嘌呤黴素抗性基因,稱為附著體CRISPR(epiCRISPR)技術(圖3A)。附著體載體不整合到基因組,但可以隨著細胞的複製而複製,就像普通質粒可以在細菌中複製一樣。在嘌呤黴素的篩選作用下附著體載體一直保留在細胞中,外源基因長期穩定的表達,可以長期編輯細胞。嘌呤黴素篩選還可以富集轉染成功的細胞,即使轉染效率很低的細胞也能夠實現高效的編輯;編輯完成後,去除篩選藥物,附著體載體會在1周內迅速丟失,細胞中不再表達外源基因(圖3B)。附著體CRISPR的編輯效率一般在80%以上,附著體CRISPR還可以實現高效的多基因敲除和基因組片段敲除[55]

如果編輯的目的是製作動物模型,則需要對動物的受精卵進行編輯。受精卵中儲備了大量的mRNA,很少有新的基因轉錄發生,因此不能使用DNA質粒表達Cas9和sgRNA,需要將sgRNA和Cas9在體外轉錄成mRNA,通過顯微注射的方法導入細胞中。製作基因編輯的小鼠和斑馬魚請參考Jaenisch和Burgess實驗室的方法[69]

2.4 提高CRISPR/Cas9的特異性

提高CRISPR/Cas9特異性的方法除了選擇特異的sgRNA序列外,還有其他方法。5』末端截短的sgRNA(Tru-sgRNA)也可以提高Cas9的特異性[70]。Tru-sgRNA一般只有17或18 bp和靶向序列互補配對,短的sgRNA可能無法和錯配的DNA序列結合,因而能夠提高特異性。在sgRNA的5′端額外加入兩個G,即5′GG+sgRNA(20 bp),也可以提高靶向特異性[70],但這兩種方法有時候會嚴重降低靶向切割效率。

雙切口(double-nicking)技術是最早報道的提高特異性的方法[49]。Cas9蛋白具有兩個核酸酶結構域,分別是RuvC和HNH,每個結構域分別負責切斷一條DNA單鏈,一個結構域突變後不影響另外一個結構域的切割功能,在RuvC結構域引入D10A突變後,Cas9隻能切斷單鏈DNA (single-strand break,SSB)。如果在DNA上設計兩個sgRNA,引導Cas9分別切斷兩條單鏈DNA,就會形成雙鏈斷裂,因為識別的DNA序列變長了,特異性就提高了[49]。單個sgRNA脫靶後只能切割產生單鏈DNA斷裂,被修復後一般不會產生突變[72]。有兩個課題組[73-74]將RuvC、HNH突變後,Cas9完全失去了切割功能,但是保留了靶向結合DNA的功能,被稱為dCas9(dead Cas9)。將dCas9和FokI融合為核酸酶,類似於前面介紹的ZFN和TALEN,單個dCas9-FokI脫靶後不會切割DNA,從而進一步提高了特異性。但是這兩種方法都有其局限性,它們需要兩個sgRNA活性都高才能有效的發揮功能,且後者對兩個sgRNA距離有嚴格的條件要求,FokI酶才能形成二聚體發揮作用,這樣的位點在基因組中非常少,因此這些方法沒有得到廣泛應用。

2015年,張鋒[75]和Keith實驗室[45]通過對SpCas9蛋白的改造提高特異性,兩個實驗室採用了不同的策略,都達到了提高特異性的目的。SpCas9與DNA結合時,它上面的正電荷氨基酸形成一個凹槽,與負電荷的的DNA結合,這種結合是非特異性的。張鋒實驗室在凹槽區域用中性電荷氨基酸來代替正電荷的氨基酸,得到的SpCas9叫做eSpCas9,它與DNA非特異性的結合力減弱,脫靶效應被降低。與此同時,Keith 實驗室採取另外一種原理降低脫靶效應。當SpCas9核酸酶與DNA結合時,SpCas9上的一些氨基酸會和DNA的磷酸骨架之間形成氫鍵,增加SpCas9和DNA之間的非特異性結合力。如果將形成氫鍵的氨基酸替換為不能形成氫鍵的氨基酸,得到的SpCas9稱為SpCas9-HF1,它與DNA非特異性的結合力減弱,從而降低脫靶效應[45]。這兩種方法雖然降低了脫靶效應,但是有時也會降低靶向切割的效率。高特異性Cas9可能會在臨床應用方面發揮重要作用,關於各種提高特異性方法的總結見表3。

基因編輯技術的原理及其在癌症研究中的應用

2.5 調控CRISPR/Cas9系統

在研究中有時需要對Cas9的表達進行精確調控,從而闡明特定時間內的基因在生物體中的功能;有時還需要能夠在特定的組織或者器官中表達Cas9,來闡釋組織特異性的基因在個體發育中的功能。基於上述的需求,科學家們開發出了多西環素(doxycycline)誘導的CRISPR/Cas9系統,在小鼠以及人類胚胎幹細胞(hES)中實現了對Cas9表達的時間控制[76-77]。有研究者[78]將Cas9蛋白分成兩個失活的片段,並且分別連接上光控蛋白,當藍光照射時,兩個光控蛋白連接到一起,Cas9核酸酶功能也隨之恢復,停止光照,Cas9蛋白會再度分開,這樣就可以通過光照從時間和空間上對內源基因的表達進行調控。

3

CRISPR/cas9技術的其他幾種應用

3.1 鹼基轉換

人類的大多數疾病都是由基因的點突變引起的。改造後的CRISPR/Cas9系統可以實現鹼基轉換,雖然基因敲入的方法可以用來製作點突變的細胞模型或者動物模型,但是敲入效率不高,基因敲入的方法更難以糾正體內的基因突變。有研究者[79]將dCas9和胞嘧啶脫氨酶(AID)偶聯在一起,可以定點地將胞嘧啶和鳥嘌呤隨機地向其他3個鹼基轉變。如果在細胞培養液中加入尿嘧啶DNA糖基化酶抑製劑,dCas9-AID可以將胞嘧啶單一地向胸腺嘧啶轉換。有研究者[80]首次運用dCas9-AID對ABL基因進行了耐葯突變篩選,伊馬替尼(imatinib)能夠抑制ABL的激酶活性,是治療慢性粒細胞白血病(ABL)的常規藥物,運用dCas9-AID和一組sgRNA對ABL基因的第六號外顯子進行突變篩選,找到了抗伊馬替尼的新突變。

3.2 表觀遺傳調控

改造後的CRISPR/Cas9系統可以用於表觀遺傳調控研究。DNA的甲基化和組蛋白的甲基化/乙醯化在表觀遺傳學中發揮非常重要的作用,對基因組特定位點進行表觀遺傳修飾,有助於了解這些位點的表觀遺傳是否調控了相關基因的表達。在CRISPR/Cas9技術之前,科學家們運用TALE和羥化酶的催化結構域(TET1)結合,實現了定點去DNA甲基化修飾[81];運用TALE和賴氨酸特異性去甲基酶(LSD1)融合,實現了對組蛋白H3 K4 和H3 K9的去甲基化修飾[82]。Hilton等[83]將dCas9和乙醯化轉移酶P300的催化結構域結合,在基因組中實現了對組蛋白H3(Lys27)定點乙醯化修飾;Kearns等[84]人將dCas9和賴氨酸特異性去甲基酶(LSD1)融合,實現了定點去除組蛋白H3 K4 和H3 K9甲基化的修飾。

3.3 內源基因的轉錄調控

改造後的CRISPR/Cas9系統可以用於調控基因的表達。有研究[85-86]顯示,在大腸桿菌和哺乳動物細胞中,dCas9靶向結合到基因的啟動子區會阻礙轉錄因子/RNA聚合酶結合到啟動子上,從而抑制了基因的轉錄。單純的dCas9抑制基因轉錄的效率較低,而將dCas9與具有轉錄抑制功能的KRAB或者是SID效應蛋白連接在一起,會提高抑制效果[83];同理,把dCas9和VP64或者P65轉錄激活功能域相融合,能夠激活內源基因的表達。一般情況下通過單個sgRNA上調基因表達的作用較小,通過多個sgRNA同時靶向一個啟動子區域會顯著增加基因表達[89-91]

3.4 全基因組範圍內的遺傳篩選

人類基因組計劃完成後,接下來的工作是要研究所有注釋基因的功能。對基因組內所有基因進行高通量的功能篩選可以快速找到想要的基因。運用CRISPR/Cas9技術能夠實現全基因組範圍內的篩選,篩選原理是對每個基因設計3~10條sgRNA,利用晶元一次合成數萬條覆蓋整個基因組sgRNA庫,把這些sgRNA連接到慢病毒載體上,包病毒、感染細胞、控制滴度使得一個細胞只得到一條sgRNA,也就是只敲除一個基因,在適當的篩選條件下測試篩選前後sgRNA的丰度變化,進而找出感興趣的基因[4, 92-95](圖4)。在CRISPR/Cas9技術出現之前,科學家們運用RNAi或者shRNA技術進行全基因組範圍內高通量的功能篩查,但是這兩種方法只能敲低基因的表達,而不能敲除,沒有CRISPR/Cas9技術篩選靈敏[95]。除了可以對基因進行高通量的篩選,zhu等[96]運用DNA片段敲除技術成功地對癌細胞中的長非編碼RNA(lncRNA)進行了高通量的功能篩選。隨後有研究者[97-98]把dCas9與轉錄激活因子(VP64和p65)或抑制因子KRAB連接,開發出了覆蓋全基因組的轉錄抑制(CRISPRi)和轉錄激活(CRISPRa)文庫,實現了對人類所有基因表達的調控篩選。

基因編輯技術的原理及其在癌症研究中的應用

圖4 全基因組範圍內的遺傳篩選流程

4

CRISPR/Cas9系統在癌症中的應用

癌症是危害人類健康的主要疾病之一。癌細胞的基因組非常複雜,含有多種基因突變,包括點突變、染色體重排、染色體增加或者減少等,最終導致了原癌基因激活或者抑癌基因失活,細胞生長失去控制。CRISPR/Cas9技術出現後,科學家們獲得了強大的改造基因組的能力,可以用它製作各種基因突變的癌症模型,研究癌症發生的機制,篩選治療藥物;也可以直接用它編輯致癌基因或者致癌病毒,治療癌症;還可以用它編輯免疫細胞,通過免疫細胞治療癌症。

4.1 建立癌症的小鼠模型

小鼠是癌症研究中最常用到的動物模型。傳統製作小鼠模型的方法是在小鼠胚胎幹細胞中引入突變,然後將幹細胞注射到胚囊中形成嵌合體小鼠,再經過一代才能獲得純合突變的小鼠。CRISPR/Cas9技術有效地提高了製作小鼠模型的效率。Jaenisch課題組[35]用CRISPR/Cas9在小鼠胚胎幹細胞中同時敲除了5個基因,隨後他們將Cas9 mRNA和靶向Tet1和Tet2的sgRNA注射到小鼠受精卵中,建立了同時敲除兩個基因的小鼠。

除了在小鼠胚胎幹細胞和生殖細胞中實現了同時編輯多個基因,CRISPR/Cas9技術在小鼠體細胞中的編輯能力也毫不遜色。Ebert課題組[99]用病毒介導的CRISPR/Cas9系統對小鼠的原代造血幹細胞的多個基因進行編輯,成功建立了急性髓性白血病(AML)模型。有研究者[100]在表達KrasG12D基因的肺癌小鼠模型中, 利用CRISPR/Cas9對一系列在人類肺癌患者可能的抑癌基因進行了功能篩查,研究這些基因與原癌基因KrasG12D在肺癌發生和發展中的協同作用。2014年,Jacks課題組[101]通過尾靜脈注射CRISPR/Cas9質粒,在小鼠肝臟中破壞腫瘤抑制基因Pten和p53,製作出了產生肝臟腫瘤的小鼠模型,該技術產生的癌症小鼠和傳統的Cre-loxp技術構建的小鼠具有相似的癌症表型。

在作體內編輯時,編碼Cas9和sgRNA的DNA太大,用病毒包裝效率很低。為了解決這個問題,張鋒課題組[102]將Cas9整合到了Rosa26位點構建出了誘導型表達Cas9的小鼠,Cas9和CAG啟動子之間有一段loxP-stop (33 polyA signal)-loxP序列阻止了Cas9的表達,再用組織特異性的啟動子表達Cre重組酶,就可以去除干擾序列起始Cas9表達。有研究者[102]用AAV病毒將靶向KRAS、p53和LKB1基因的sgRNA的轉導到Cas9小鼠的肺中,成功建立了小鼠肺癌模型。至此,科研工作者可以利用誘導表達Cas9的小鼠進行遺傳操控,快速在體內建立癌症模型。

4.2 建立染色體重排的癌症模型

染色體重排指的是染色體片段位置的改變,包括染色體缺失、重複、倒位和異位。染色體重排有可能誘發細胞癌變,人類淋巴瘤和白血病的形成就是由於染色體重排引起的[103-104]。運用傳統的方法製作染色體重排的癌症模型,需要在兩個重排位點加上loxP序列,通過Cre-loxP重組製作染色體重排。運用CRISPR/Cas9技術產生染色體重排非常簡單,只需要靶向切割兩個重排位點就可以了。人類2號染色體重排會導致EML4-ALK融合表達,引發非小細胞肺癌。有研究者[105-106]使用病毒介導的CRISPR/Cas9技術對成年小鼠體細胞進行編輯重排,快速地建立了EML4-ALK融合基因肺癌小鼠模型。隨後又有研究者[107]使用相似的技術製作了急性髓性白血病和尤文氏肉瘤染色體重排的癌症小鼠模型。這些模型為科學家深入研究癌症的發生機制以及在動物水平篩選抗腫瘤藥物等提供了有效的平台。

4.3 高通量篩查與腫瘤細胞轉移相關的基因

腫瘤發生是多個基因突變協同作用的結果,研究癌症面臨的主要挑戰是如何找出引發癌症的關鍵突變。2015年,張峰實驗室和Sharp團隊合作,運用CRISPR/Cas9文庫對一個不具備轉移能力的肺癌細胞系進行了高通量的單基因隨機敲除,然後移植到免疫缺陷的小鼠中,其中一些細胞離開了原有的位置隨著血管遷移形成了高轉移性的腫瘤;通過對轉移性腫瘤的sgRNA測序,篩查到了與癌症生成和轉移相關的多個基因以及微小RNA(microRNA)[92]。因此,CRISPR/Cas9文庫技術為篩查引發癌細胞遷移的關鍵基因提供了新的思路。

4.4 癌症治療

CRISPR/Cas9有兩種方式用於治療癌症,一種是直接攻擊癌細胞中的關鍵基因,另一種是用於編輯免疫細胞,通過免疫細胞攻擊癌細胞。我國科學家[108]在膀胱癌細胞中製作了邏輯門控制的膀胱癌特異表達的Cas9和sgRNA系統,同時構建了LacI抑制蛋白控制表達的抑癌基因p21、E-cadherin和hBax的表達系統。在膀胱癌細胞中CRISPR/Cas9將LacI敲除,抑癌基因得以表達,從而抑制了癌細胞的增殖和遷移,並導致了癌細胞凋亡。MCL1是一個抗凋亡蛋白,對人Burkitt 淋巴瘤(BL)生存是必須的。Aubrey課題組[109]用CRISPR/Cas9技術敲除了MCL1基因,導致了淋巴瘤細胞大量凋亡。一些病毒是導致癌症的罪魁禍首,例如Epstein-Barr 病毒(EBV)感染會導致Burkitt 淋巴瘤。利用CRISPR/Cas9敲除EBV可以顯著地抑制腫瘤的增殖[110]。CRISPR/Cas9在癌症治療中最吸引人的一個應用是編輯CAR-T細胞,CAR-T細胞可以攻擊腫瘤細胞。TALEN技術已經被用於編輯CAR-T細胞,消除HLA不匹配引發的免疫排斥。在NIH臨床試驗註冊官網www.clinicaltrials.gov上搜索CRISPR,有10項與CRISPR/Cas9相關的臨床試驗,其中7項與治療癌症相關。值得一提的是,我國四川大學附屬華西醫院開展了全球第一例應用CRISPR/Cas9技術的治療肺癌的人體臨床試驗[111];中山醫科大學附屬第一醫院開展了全球第一例應用CRISPR/Cas9技術清除體內HPV病毒,預防性治療HPV誘發宮頸癌的臨床試驗,見NIH臨床試驗註冊官網。

5

結語

從2013年第一次實現對哺乳動物細胞的編輯到現在,短短4年時間,CRISPR/Cas9技術已經在生物學的很多領域大放異彩。ZFN技術和TALEN技術也有各自的優點,它們將和CRISPR/Cas9技術長期共存,互為補充。隨著各種基因編輯技術的發展和完善,科研人員將具備更加有效的工具開展基礎生命科學和人類疾病的研究,在不久的將來,基因編輯技術將在治療癌症和遺傳疾病方面帶來革命性的變化。

參考文獻

[1]MANSOUR S L, THOMAS K R, CAPECCHI M R.Disruption of the proto-oncogene int-2 in mouse embryo-derived stem cells: a general strategy for targeting mutations to non-selectable genes[J]. Nature, 1988, 336(6197): 348-352. DOI:10.1038/336348a0.

[2]CAPECCHI M R. Altering the genome by homologous recombination[J]. Science, 1989,244(4910):1288-1292.PMID: 25556236.

[3]ROUET P, SMIH F, JASIN M. Expression of a site-specific endonuclease stimulates homologous recombination in mammalian cells[J]. Proc Natl Acad Sci U S A, 1994,91(13):6064-6068.PMCID: PMC44138.

下略

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 醫學空間 的精彩文章:

醫生「心如明鏡」,你卻「一無所知」不要再做聰明的「傻子」!
層螺旋CT多平面重建技術在闌尾炎診斷中的應用
精準醫學背景下先天性巨結腸的研究進展
「醫學改變人類」青黴素的曲折發現歷史
癌症生存者不能成為「失醫者」

TAG:醫學空間 |