Exonization evenimente apar în introni îmbogățit cu noi transpozoni
Pentru a investiga potențialul de roman exonization evenimente să apară în om transcriptomului, am analizat peste 400 de shRNA trântă ARN-următoarele seturi de date de la HepG2 linii celulare de a identifica citește mapare între cunoscut exoni și roman intronic secvențe (Fig. 1a și secțiunea „Metode”)., Am considerat doar cartografierea citirilor la intersecțiile exon-exon (EEJs) susținute de cel puțin 5 citiri și o valoare procentuală îmbinată (PSI) de cel puțin 5%. Exonii noi au fost definiți ca fiind cei absenți din bazele de date de adnotare și din toate seturile de date de control non-perturbate (Fig. 1a). Confirmând validitatea acestei abordări, doborare a ARN-ului binding protein (RBP) eterogene ribonucleoprotein C (hnRNPC) a creat cele mai Alu-derivate exonization evenimente (fișier Suplimentar 1: Figura S1), în conformitate cu observațiile anterioare . În total, am detectat 13,103 roman exonic evenimente în 4774 gene sau 30.,6% din genele de codificare a proteinelor umane evaluate sub perturbațiile pe care le-am examinat.
Pentru a investiga mecanismele care stau la baza acestor exonization evenimente, am asamblat o listă de caracteristici clasic asociat cu despicare alternative, inclusiv splice site-ul puterea, GC conținut, și polypyrimidine intestinal lungime (fișier Suplimentar 2: Tabelul S1)., Regresia liniară logistică a fost apoi utilizată pentru a compara aceste evenimente cu un grup” de fond ” de introni exprimați care nu au nicio dovadă de exonizare (Fig. 1b). Validând alegerea noastră de caracteristici genomice, modelul nostru atinge o rată medie pozitivă reală ridicată de 75,2% (fișierul suplimentar 1: Figura S1). Mai mult decât atât, noi am fost capabil pentru a confirma rezultatele anterioare, care exonization evenimente tind să apară în timp introni cu o mare GC conținut (fișier Suplimentar 1: Figura S1, intron lungime: p < 3.53 × 10-59, GC 1.01 × 10-73, testul t-Student)., În special, vom găsi exonization evenimente de multe ori se suprapun nucleosome-site-uri de legare (fișier Suplimentar 1: Figura S1, p < 2.37 × 10-23, testul Wilcoxon), foarte rar apar la 3-end de gene corpului (p < 5.90 × 10-21, testul t-Student) și arată o semnificativă tendință să apară în termen de 5-UTRs (fișier Suplimentar 1: Figura S1, p < 7.13 × 10-166, testul Fisher exact). Important, observăm, de asemenea, că cel mai puternic predictor pentru exonizare a fost apariția elementelor transpozabile care se suprapun romanului exon (Fig., 1B și fișier suplimentar 1: Figura S1, p < 6.46 × 10-127, Student t test). În comparație cu acești predictori puternici ai, nu csi-de reglementare despicare elemente contribuie în mod semnificativ la modelul sau arată diferențe semnificative între seturi de date (fișier Suplimentar 1: Figura S1, p > de 0,05, testul t-Student).
Pentru a evalua conservarea roman exonul utilizare pe specii, am analizat gradul de exonization potrivesc pe mai multe tipuri de țesut în patru specii de primate se întinde de 30 de milioane de ani de primat evoluție., Pentru a explora utilizarea exonizării între probe, genele cu evenimente care apar la toate cele patru specii au fost identificate și sortate folosind gruparea de propagare a afinității. În conformitate cu îmbinarea alternativă canonică , eșantioanele din aceeași specie au fost grupate invariabil împreună (fișierul suplimentar 1: Figura S2). Excepția notabilă de la această tendință a fost observată la probele din testicule, care au arătat gruparea specifică țesutului. Acest lucru sugerează că în testicule există o semnătură puternică de exonizare conservată la speciile de primate în mai multe gene (fișier suplimentar 1: Figura S2).,pentru a investiga în continuare influența retrotransposonilor asupra exonizării, am sub-împărțit elementele transpozabile în sub-familiile lor majore. În conformitate cu specificitatea descendentă a evenimentelor de exonizare, cei mai importanți contribuitori la model sunt transpozonii mai tineri de 70 de milioane de ani. În special, membrii sub-familiei Alu AluJ și AluS, precum și elementele L1 extrem de mobile sunt predictori puternici (Fig. 1C). Interesant, o excepție de la această regulă este sub-familia AluY , care arată un model care amintește de evenimente transposon mult mai vechi (Fig. 1C)., Această diferență este potențial datorită relativă epuizare în gene organisme (3%, 19%, AluY, AluS, apariția în a exprimat introni). În cele din urmă, am dorit să evaluăm ce tip de gene conține evenimente de Alu-exonizare. Interesant este că găsim o îmbogățire puternică pentru funcțiile legate de semnalizarea celulară și reglarea ciclului celular (Fig. 1D, fișier suplimentar 1: Figura S1 și fișier suplimentar 3: tabelul S2). Pe lângă exemplele anterioare , observarea unui număr mare de evenimente de exonizare care se suprapun noilor transpozoane sugerează o nouă sursă de complexitate transcriptomică.,
m6a ARN proteine de legare a suprima exonization
O evaluare trans-factori de promovare a exonization (fișier Suplimentar 1: Figura S2 și Suplimentare de fișiere 4: Tabelul S3) a relevat o îmbogățire de m6a (N6-methyladenosine) obligatoriu RBPs, în special în rândul Alu-conțin roman exoni (Fig. 2a, p < 0,05, test hipermetric). Aceasta a inclus hnRNPC, care a fost anterior dovedit a induce un număr mare de Alu-specifice exonization evenimente , precum și sindromul DiGeorge regiunea critică 8 (DGCR8) și YTH domeniu-care conțin proteine 2 (YTHDC2)., Pentru a examina rolul potențial al m6a marchează în exonization, am analizat trântă date de m6a modificarea enzimei N6-adenozin-metiltransferază subunitate (METTL3) . Această analiză a relevat o creștere semnificativă a numărului de evenimente de exonizare detectabile la knockdown METTL3 (Fig. 2b, p < 3.57 × 10-03, Wilcox-rank sum test), în concordanță m6a care reglementează includerea de noi exoni. O analiză suplimentară a acestor METTL3-dependente exonization evenimente au pus în evidență o funcțională de îmbogățire de gene asociate cu deteriorarea ADN-ului (p < 2.,68 × 10-02, valoarea p corectată FDR). Apoi, am analizat datele din celulele HeLa constituie din două lovituri de cunoscut m6a de reglementare (Serină/arginina-bogat despicare factorul 3 (SRSF3) și YTH domeniu-care conțin proteine 1 (YTHDC1)) și două lovituri de RBPs nu a cunoscut direct recunosc m6a (Serină/arginina-bogat despicare factor de 9 și 10 (SRSF9 și SRSF10)) . În acord cu rezultatele anterioare, aflăm că trântă fie SRSF3 sau YTHDC2 puternic induce exonization întrucât scăderea expresia SRSF9 sau SRSF10 are puțin sau nici un impact (fișier Suplimentar 1: Figura S2).,
Să evalueze dacă m6a modificarea efectelor exonization evenimente, am evaluat îmbogățirea m6a site-uri în exonized secvențe . Această abordare a folosit BrU-seq urmată de izolarea fragmentelor M6A-metilat folosind un anticorp specific m6a . Datorită naturii repetitive a elementelor Alu, am folosit maximizarea așteptărilor pentru a atribui citirile multimapping (maximum 10 meciuri permise) elementelor Alu pe baza expresiei genei gazdă ., Ca un set de comparație, am examinat toate Alu-elementele din regiunile intronice exprimate care nu se află în vecinătatea unui exon nou (vezi secțiunea „Metode”). Această analiză a evidențiat o îmbogățire puternică a cartografierii siturilor m6a cu elemente Alu exonizate (Fig. 2c, p < 3.23 × 10-123, testul Wilcoxon rank-sum; Fig. 2d, p < 2.13 × 10-63, testul Wilcoxon rank sum; fișier suplimentar 1: Figura S2). În total, acest lucru sugerează modificarea m6a și proteinele de legare sunt regulatori cheie ai evenimentelor de exonizare (care conțin Alu).,
Mecanisme de creștere „fereastra de oportunitate” pentru spliceosome recrutare a promova exonization
Noastre inițiale, analiza a relevat predicția exonization este puternic consolidată prin elemente repeta, intron lungime și GC conținut. Se știe că aceste caracteristici se corelează negativ cu rata de alungire a ARN polimerazei II (RNAPII). Prin urmare, am emis ipoteza că modificările ratei de alungire a RNAPII pot promova exonizarea., Pentru a testa acest lucru, am analizat ARN-următoarele date din celulele umane care exprimă mutații care crește (E1126G) sau scădere (R749H) rata de alungire ARN polimeraza II (RNAPII) . Pentru a determina rata de alungire pentru fiecare mutant, am analizat datele din testul de secvențiere nucleară la nivel de genom (GRO-seq) combinat cu inhibitorul de alungire a transcripției DRB (vezi secțiunea „Metode” și ). Observăm că mutațiile care încetinesc rata de alungire a RNAPII (R749H) au indus puternic evenimente de exonizare (Fig. 3a, toate: p < 3.,18 × 10−45, Fisher’s exact test), with this change especially strong in Alu-containing novel exons (Fig. 3a, ALU: p < 5.62 × 10−53, Fisher’s exact test). In contrast, mutations that speed up elongation had negligible effects on the number of exonization events detected (Fig. 3a; p > 0.05, Fisher’s exact test).
Acest rezultat susține concurența model de despicare alternativă în care regulamentul de exonul incluziunea este asociat cu o „fereastră de oportunitate” pentru spliceosome de recunoaștere. Dacă această legătură între exonization și oportunitate este valabil, un mecanism independent pentru apariția de noi exoni ar trebui să apară în termen de introni, care sunt încet, prelucrate de despicare utilaje., Pentru a evalua această ipoteză, am analizat datele ARN născute din BrU-Chase-seq , în care celulele sunt etichetate cu un puls BrU de 15 min și urmărite pentru 0, 15, 30 și 60 min. Pentru a determina cinetica splicing pentru fiecare intron, am calculat dinamica splicing efficiency dynamics (SEDs) sau rata de excizie intron (vezi secțiunea „Metode”). K-means clustering a fost apoi utilizat pentru a identifica cinci grupuri de introni cu SEDs variind de la foarte rapid la foarte lent (fișier suplimentar 1: Figura S3). Intronii care conțineau evenimente de exonizare au fost apoi comparați cu un set de fundal al tuturor intronilor exprimați., În mod izbitor, această analiză arată că intronii care conțin evenimente de exonizare sunt puternic îmbogățiți în cel mai lent cluster SED (Fig. 3b, p < 3.23 × 10-239, testul Wilcox rank-sum și fișierul suplimentar 1: Figura S3). Mai mult, acești introni prezintă o reducere foarte semnificativă a SED în comparație cu grupurile de fundal (Fig. 3C și fișierul suplimentar 1: Figura S3, p < 2.2 × 10-160, testul Wilcoxon rank-sum)., Împreună, aceste observații sugerează că mecanismele care extind „fereastra de oportunitate” vor crește probabilitatea recunoașterii de către mașinile de despicare și, prin urmare, vor promova rata de exonizare.
deteriorarea ADN-ului induce exonization în cadrul ciclului celular gene
Exogene proces poate promova, de asemenea, modificări în transcriere alungire și, prin urmare poate modifica ratele de exonization., Pentru a investiga acest lucru ne-am concentrat pe urma iradierii cu UV ca studii anterioare au demonstrat că promovează atât hyperphosphorylation de RNAPII ceea ce duce la inhibarea ulterioară de transcriere alungire și recrutarea de m6a utilaje pentru site-uri de deteriorarea ADN-ului . Folosind datele obținute din ARN-seq în formare (protocolul GRO-seq), am evaluat impactul iradierii UV asupra Alu-exonizării pe o perioadă de 24 de ore . În mod remarcabil, în urma scăderii abrupte a ratei de alungire a RNAPII la iradierea UV, găsim o creștere accentuată la fel de izbitoare a ratei de exonizare (Fig., 4A și fișier suplimentar 1: Figura S4). Această încorporare a exonilor noi continuă să crească atâta timp cât rata de alungire a RNAPII rămâne scăzută. Important, recuperarea completă a ratei de alungire a RNAPII la marcajul 24-h este însoțită de o scădere precipitată a numărului de evenimente de exonizare detectabile (Fig. 4A și fișier suplimentar 1: Figura S4).
Având în vedere rezultatele anterioare care Alu-conțin secvențe pot promova nucleare de retenție , am investigat dacă la iradiere UV la polysome-angajament de gene a fost afectat de exonization ., În special, după iradiere UV identificăm o scădere semnificativă a nivelurilor de expresie a genelor care conțin Alu-conțin exonization evenimente în cadrul polysome fracțiune, comparativ cu întreaga celula ARN-seq expresia (Fig. 4b, p < 8.50 × 10-22, testul Wilcoxon rank-sum). Mai mult, puterea mediană a acestei epuizări crește odată cu procentul de includere al exonilor noi (Fig. 4c, p < 1.49 × 10-06, testul Wilcox rank-sum).,în continuare am fost interesați să investigăm tipul de gene în care evenimentele de exonizare sunt promovate după iradierea UV. Interesant este că există o îmbogățire puternică pentru genele implicate în reglarea ciclului celular și legarea ARN (Fig. 4D și fișier suplimentar 1: Figura S4). În total, aceste rezultate sugerează că deteriorarea ADN-ului reduce implicarea ribozomală a genelor ciclului celular parțial prin promovarea evenimentelor de exonizare care conțin elemente Alu, despre care se știe că induc retenția nucleară ., În cele din urmă, am investigat dacă acesta a fost un mecanism conservat evolutiv prin evaluarea ratelor de exonizare la iradierea UV la fibroblastele embrionare de șoarece. În mod remarcabil, identificăm o creștere clară a evenimentelor de exonizare în probele tratate cu UV față de cele netratate, cu includerea repetițiilor B specifice rozătoarelor afectate în mod special (fișierul suplimentar 1: Figura S4). Analiza funcțională a genelor care conțin exoni noi a relevat încă o dată o îmbogățire puternică pentru genele ciclului celular (fișierul suplimentar 1: Figura S4).,
Exonizarea este epuizată în cancerele hematologice
îmbinarea aberantă este un semn distinctiv al cancerului și contribuie la numeroase aspecte ale biologiei tumorale . Modificările asociate cancerului în splicing au fost legate de expresia modificată a RBPs, dintre care unele sunt oncogene sau acționează ca supresoare tumorale . În ciuda dovezilor extinse pentru îmbinarea modificată în cancer, măsura în care aceste modificări afectează exonizarea nu a fost explorată., Prin urmare, am evaluat apariția exonizării pe probe de tumori și de control potrivite ale pacienților dintr-o varietate de tipuri diferite de cancer (fișier suplimentar 5: Tabelul S4). În mod remarcabil, această analiză a evidențiat o suprimare semnificativă și reproductibilă a exonizării în probele de pacienți cu leucemie limfocitară cronică (LLC) și sindroame mielodisplazice (MDS) (Fig. 5a, CLL: p < 2.14 × 10-04; MDS: p < 1.15 × 10-04; AML: p < 4.,02 × 10-09; Wilcoxon rank-sum test), care a fost independent de modificările de Expresie (fișier suplimentar 1: Figura S5). Mai mult, această suprimare a exonizării este specifică malignităților hematologice (Fig. 5b, p < 2.93 × 10-09, testul Wilcoxon rank sum). În concordanță cu observațiile noastre anterioare, includerea exonilor noi este suprimată în genele asociate cu ciclul celular și procesarea ARNm (fișierul suplimentar 1: Figura S5 și fișierul suplimentar 6: tabelul S5, p < 1 × 10-5, FDR corectat, comparativ cu probele de control).,
Recent întreg-genome-wide de secvențiere studii de probe prelevate de la pacienți cu sindroame mielodisplazice au relevat frecvente mutații somatice într-un grup-cheie de spliceosome-asociat proteinelor, inclusiv Serină/arginina-bogat despicare factor 2 (SRSF2) și Despicare factor U2AF 35 kDa subunitate.
(U2AF1). Aceste mutații au ca rezultat îmbinarea greșită a sute de transcrieri ., Dat fiind locul de munca anterioare care leagă U2AF1 regulament și exonization evenimente , am explorat dacă aceste tipuri de mutatii pot ajuta la explicarea suprimarea exonization observate în datele pacientului. Pentru a investiga această posibilitate, am analizat GRO-următoarele date dintr-un HEK-293 linie de celule exprimarea de tip sălbatic (SRSF2 sau U2AF1) sau mutant despicare factori cu (SRSF2(P95H), U2AF1(Q157P)) și fără (U2AF1(S34F)) câștig de despicare funcția de mutații . Această analiză a arătat că atât P95H mutație în SRSF2 și Q157P mutație în U2AF1 inhibată rata de roman exonul incluziune (Fig., 5c, p < 1.46 × 10-03, Wilcox-rank sum test, comparativ cu lotul de control), în timp ce S34F în U2AF1 avut prea puțin efect. Pentru a investiga dacă aceste modificări reflectă sarcina mutațională a probelor de pacienți cu MDS, am grupat aceste date împreună pe baza mutațiilor genomice din RBPs-urile lor. În acord cu datele liniei celulare, această analiză a evidențiat o stratificare a exonizării pe baza tipului de mutație genomică RBP (Fig. 5D și fișier suplimentar 1: Figura S5).,
Pentru a investiga dacă această suprimare a exonization în florin ar putea fi ușurată prin scăderea ratei de transcriptie alungire, am evaluat impactul de droguri ARV–825, care este cunoscut a inhiba RNAPII alungire prin promovarea degradarea Bromodomain-conțin proteine 4 (BRD4) . Analiza probelor de pacienți cu cAML a replicat rezultatele noastre anterioare care arată suprimarea exonizării (Fig. 5e). Foarte important, această suprimare este inversată la aplicarea inhibitorilor BRD4 cu o creștere de 12 ori a numărului de evenimente de exonizare detectate (Fig., 5e, p < 4.86 × 10-91, hipergeometrică test). În total, acest lucru sugerează că în cancerele de sânge evenimentele de exonizare din genele ciclului celular sunt suprimate, dar pot fi puternic inversate prin intervenția farmacologică care mărește „fereastra de oportunitate”.