增強(qiáng)子及超級(jí)增強(qiáng)子序列查找
來(lái)源/作者:普拉特澤-生物醫(yī)學(xué)整體課題外包平臺(tái)
一、什么是增強(qiáng)子?
增強(qiáng)子是指能夠增加啟動(dòng)子活性, 從而增加基因轉(zhuǎn)錄效率的DNA序列。增強(qiáng)子分為細(xì)胞特異性增強(qiáng)子和誘導(dǎo)性增強(qiáng)子兩種類型:細(xì)胞特異性增強(qiáng)子是在特定的細(xì)胞或特定的細(xì)胞發(fā)育階段, 有選擇性的調(diào)控基因轉(zhuǎn)錄表達(dá)。誘導(dǎo)性增強(qiáng)子在特定刺激因子的誘導(dǎo)下才能發(fā)揮起增強(qiáng)基因轉(zhuǎn)錄活性的增強(qiáng)子,。在我們NCBI第一講視頻也介紹了,增強(qiáng)子具有遠(yuǎn)距離效應(yīng)、無(wú)方向性、無(wú)物種和基因的特異性、具有組織特異性、等特點(diǎn)。
圖一、增強(qiáng)子結(jié)構(gòu)示意圖
二、增強(qiáng)子和啟動(dòng)子的相互作用
我們已經(jīng)知道啟動(dòng)子決定轉(zhuǎn)錄的起始位點(diǎn),而增強(qiáng)子決定轉(zhuǎn)錄的效率及轉(zhuǎn)錄的時(shí)間和地點(diǎn),但是增強(qiáng)子如何促進(jìn)啟動(dòng)子的轉(zhuǎn)錄,是轉(zhuǎn)錄領(lǐng)域里面懸而未決的問題。啟動(dòng)子的位置一般是確定的,即與基因之間有特定的距離和方向,增強(qiáng)子則不同,由于它的遠(yuǎn)距離效應(yīng),它可能與其調(diào)節(jié)的啟動(dòng)子相距數(shù)千Kb,可以位于基因上游或下游。那增強(qiáng)子是如何跟啟動(dòng)子相互作用從而影響基因的轉(zhuǎn)錄的呢?一般認(rèn)為當(dāng)處于非活性狀態(tài)時(shí),二者不會(huì)靠近,但在活性狀態(tài)下,增強(qiáng)子通過形成環(huán)狀結(jié)構(gòu)而在三維空間上接近啟動(dòng)子,并將相應(yīng)轉(zhuǎn)錄因子募集到該區(qū)域,從而促進(jìn)基因表達(dá)。
(下圖顯示了增強(qiáng)子如何與啟動(dòng)子相互作用從而增強(qiáng)基因的表達(dá)。藍(lán)色線條代表染色體,左邊形成環(huán)狀的這個(gè)區(qū)域叫做染色的凸環(huán)loop,這個(gè)環(huán)是怎么形成的呢?假設(shè)染色體上這個(gè)紫色區(qū)域就是一個(gè)基因,這個(gè)基因左邊是它的基因的啟動(dòng)子promoter,在這個(gè)基因的上游區(qū)域或者下游區(qū)域會(huì)存在增強(qiáng)子即enhancer,這個(gè)染色體的這個(gè)凸環(huán)就是靠這個(gè)增強(qiáng)子和啟動(dòng)子之間的關(guān)聯(lián)而形成的,一旦形成了這種折疊染色體凸環(huán),增強(qiáng)子和啟動(dòng)子之間的距離就被拉進(jìn)。它們又是如何保持這種結(jié)構(gòu)關(guān)系的呢?這兩個(gè)紅色的鋸齒狀代表兩個(gè)結(jié)構(gòu)蛋白,上面這個(gè)鋸齒狀結(jié)構(gòu)蛋白它錨定在增強(qiáng)子上面,下面這個(gè)鋸齒狀的結(jié)構(gòu)蛋白它錨定在啟動(dòng)子上面,這兩個(gè)蛋白連接在一起形成了一個(gè)二聚體的穩(wěn)定結(jié)構(gòu),這個(gè)二聚體有助于染色體保持現(xiàn)在這種形狀。
圖中的梯形狀的結(jié)構(gòu)代表轉(zhuǎn)錄因子,在轉(zhuǎn)錄因子那節(jié)的視頻中我們介紹了,轉(zhuǎn)錄因子分為通用轉(zhuǎn)錄因子和激活因子,通用轉(zhuǎn)錄因子只能激活很低水平的轉(zhuǎn)錄,細(xì)胞中活躍基因的轉(zhuǎn)錄通常遠(yuǎn)遠(yuǎn)高于本地轉(zhuǎn)錄,要達(dá)到所需的轉(zhuǎn)錄增強(qiáng),通常需要激活因子來(lái)激活高水平的轉(zhuǎn)錄,而激活因子通常需要跟增強(qiáng)子結(jié)合從而才能達(dá)到激發(fā)高水平轉(zhuǎn)錄的作用。特定的轉(zhuǎn)錄因子(也就是激活因子)與增強(qiáng)子結(jié)合,而普通轉(zhuǎn)錄因子和啟動(dòng)子結(jié)合。激活因子結(jié)合到增強(qiáng)子上(圖中紅色五角星),增強(qiáng)子被激活,被激活的增強(qiáng)子進(jìn)一步激活靶基因的啟動(dòng)子,遠(yuǎn)距離的啟動(dòng)子是如何被激活的呢?在增強(qiáng)子和啟動(dòng)子之間會(huì)有一個(gè)酶介,這個(gè)酶介叫Mediator protein中介蛋白,這個(gè)蛋白大約由26個(gè)蛋白組成的復(fù)合物,被激活的這個(gè)增強(qiáng)子通過中間這個(gè)蛋白復(fù)合體,將信號(hào)傳遞給啟動(dòng)子,從而激活啟動(dòng)子開始轉(zhuǎn)錄,開始轉(zhuǎn)錄以后在RNA聚合酶2的作用下就可以開始轉(zhuǎn)錄形成mRNA,同時(shí)這個(gè)增強(qiáng)子它也會(huì)在這個(gè)RNA聚合酶2的作用下形成eRNA。)
圖二、真核基因轉(zhuǎn)錄調(diào)控(增強(qiáng)子和啟動(dòng)子的相互作用)
三、什么是超級(jí)增強(qiáng)子?
除了增強(qiáng)子是調(diào)控細(xì)胞基因時(shí)空表達(dá)關(guān)鍵的順式作用元件外,2013年有科學(xué)家基于當(dāng)時(shí)增強(qiáng)子的研究,第一次提出了超級(jí)增強(qiáng)子(Super-enhancer, SE)概念,并將相關(guān)研究結(jié)果發(fā)表在Cell期刊上。超級(jí)增強(qiáng)子(Super-enhancer, SE)是基因組中大量增強(qiáng)子富集的轉(zhuǎn)錄調(diào)控區(qū)域,能夠大幅度地激活基因的表達(dá),且具有較高的組織特異性。與普通增強(qiáng)子相比,超級(jí)增強(qiáng)子的區(qū)域跨度范圍通??蛇_(dá)820Kb,遠(yuǎn)高于普通增強(qiáng)子的200-300bp跨度范圍。此外,超級(jí)增強(qiáng)子比普通增強(qiáng)子具有更強(qiáng)的轉(zhuǎn)錄激活相關(guān)組蛋白修飾、輔因子及轉(zhuǎn)錄因子富集密度,可以富集高密度的關(guān)鍵轉(zhuǎn)錄因子(Master transcription factors)、Bromodomain containing4蛋白(BRD4)、輔因子(Mediator,cohesin)和增強(qiáng)子表觀修飾標(biāo)記(H3K27ac,H3Kme1等)、染色質(zhì)修飾因子(P300、Pol2和DNAseⅠ等),通過這些特征我們可以識(shí)別增強(qiáng)子或者超級(jí)增強(qiáng)子。
圖三、超級(jí)增強(qiáng)子結(jié)構(gòu)示意圖
四、為什么要研究超級(jí)增強(qiáng)子
一個(gè)課題最開始往往是研究某個(gè)基因的序列信息以及基因所行駛的功能作用,這些是屬于基因的下游研究。但當(dāng)下游研究累積到一定經(jīng)驗(yàn)之后,大家往往開始著手于研究基因的上游調(diào)控機(jī)理,即不單關(guān)注某個(gè)基因如何影響細(xì)胞活動(dòng),更關(guān)注哪些因素影響這個(gè)基因的功能發(fā)揮。調(diào)控機(jī)理研究理論上會(huì)涉及多個(gè)層面的因素,例如:轉(zhuǎn)錄因子、增強(qiáng)子、蛋白激酶、miRNA、DNA甲基化、組蛋白修飾、lncRNA等。上節(jié)視頻我們學(xué)習(xí)了轉(zhuǎn)錄因子的相關(guān)內(nèi)容,而增強(qiáng)子跟轉(zhuǎn)錄因子一樣,也會(huì)影響基因轉(zhuǎn)錄。其中普通增強(qiáng)子影響的基因范圍比較小,而超級(jí)增強(qiáng)子會(huì)影響大量的基因,如果我們能抓住上游的超級(jí)增強(qiáng)子,也就意味著我們能拿捏下游很多的靶基因(打個(gè)比方:擒賊先擒王。。。),幫助我們?nèi)ジ玫耐诰蚧虻恼麄€(gè)表達(dá)調(diào)控網(wǎng)絡(luò)。從2013年至今,以SE為研究對(duì)象的高分文章不斷涌現(xiàn),文章已有6000多篇(雖然多,但是不算多,且由于疫情的影響2023年發(fā)文數(shù)量明顯下降,非常具有研究前景),目前對(duì)于超級(jí)增強(qiáng)子的大部分研究是在惡性腫瘤中進(jìn)行的,涉及到多種癌癥類型包括白血病、結(jié)直腸癌/大腸癌、乳腺癌、肝癌、膠質(zhì)瘤、肺癌等,表明其在惡性腫瘤發(fā)生、細(xì)胞分化、免疫應(yīng)答等重要生物學(xué)過程中發(fā)揮著重要調(diào)控功能。
五、如何對(duì)增強(qiáng)子和超級(jí)增強(qiáng)子進(jìn)行鑒定
我們要研究某個(gè)基因的增強(qiáng)子和超級(jí)增強(qiáng)子的功能,首先需要用實(shí)驗(yàn)(如經(jīng)典的ChIP-seq實(shí)驗(yàn))來(lái)識(shí)別目的樣本中的增強(qiáng)子序列(增強(qiáng)子一般具有組織或細(xì)胞特異性,許多增強(qiáng)子只在某些細(xì)胞或組織中表現(xiàn)活性);然后基于基因敲除或基因干擾技術(shù),研究SE的功能。
根據(jù)目前已有的研究,增強(qiáng)子區(qū)域有許多特定的特征,可以幫助我們鑒定基因組中的增強(qiáng)子,包括輔因子(Mediator、cohesion)、組蛋白修飾標(biāo)記(H3K27ac和H3K4me1)、染色體修飾分子(p300)、BET家族蛋白(BRD4)、RNA聚合酶II等。Mediator是轉(zhuǎn)錄因子和RNA聚合酶II的橋梁,用于調(diào)節(jié)基因的轉(zhuǎn)錄;而cohesion是染色質(zhì)三維結(jié)構(gòu)的重要角色;H3K27ac可以識(shí)別大部分由主轉(zhuǎn)錄因子形成的超級(jí)增強(qiáng)子以及數(shù)據(jù)的準(zhǔn)確,目前以 H3K27ac為標(biāo)記的識(shí)別最為廣泛;BRD4和p300是轉(zhuǎn)錄因子結(jié)合的共激活因子,同時(shí)P300作為組蛋白乙酰轉(zhuǎn)移酶,是增強(qiáng)子活性標(biāo)志物,能夠通過染色質(zhì)重塑來(lái)調(diào)節(jié)轉(zhuǎn)錄(為了更好地預(yù)測(cè)和表征增強(qiáng)子,應(yīng)該并行研究多個(gè)特征,因?yàn)榫哂袉我惶卣鞯膮^(qū)域也可能是其他順式調(diào)控元件或基因編碼區(qū))。識(shí)別到增強(qiáng)子之后,利用ROSE軟件,根據(jù)增強(qiáng)子轉(zhuǎn)錄活性標(biāo)記分子結(jié)合水平強(qiáng)度的差異鑒定超級(jí)增強(qiáng)子和普通增強(qiáng)子,繼而進(jìn)行后續(xù)的功能實(shí)驗(yàn)。
圖四、超級(jí)增強(qiáng)子鑒定流程
六、怎么通過數(shù)據(jù)庫(kù)查找增強(qiáng)子和超級(jí)增強(qiáng)子序列
利用上述實(shí)驗(yàn)辦法鑒定增強(qiáng)子和超級(jí)增強(qiáng)子耗時(shí)且需要投入大量財(cái)力,隨著計(jì)算機(jī)的發(fā)展,逐漸開發(fā)出許多的增強(qiáng)子數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)可以幫助我們預(yù)測(cè)增強(qiáng)子的位置、所包括的活性修飾及可對(duì)增強(qiáng)子進(jìn)行系統(tǒng)的整合和分析,后續(xù)也可以輔助驗(yàn)證CHIP實(shí)驗(yàn)數(shù)據(jù)。目前主要有這幾個(gè)數(shù)據(jù)庫(kù)可供使用:SEA(包含人類、 小鼠、果蠅和秀麗隱桿線蟲、斑馬魚、雞、黑猩猩、恒河猴、綿羊、非洲爪蟾和棘魚等11個(gè)物種的增強(qiáng)子信息);dbSuper(包含人和小鼠的增強(qiáng)子數(shù)據(jù));SEanalysis和SEdb(包含人的增強(qiáng)子數(shù)據(jù)),我們將給大家演示如何利用上述數(shù)據(jù)庫(kù)進(jìn)行增強(qiáng)子和超級(jí)增強(qiáng)子的預(yù)測(cè),希望能給大家?guī)?lái)新的研究視角。大家想看版本的可直接點(diǎn)擊↓↓↓
→→還可以和小伙伴加入交流群一起探討哦