los eventos de Exonización ocurren en intrones enriquecidos con nuevos transposones
para investigar el potencial de que ocurran nuevos eventos de exonización dentro del transcriptoma humano, analizamos más de 400 conjuntos de datos ARN-seq de Fig. 1a y la sección «Métodos»)., Solo consideramos que las lecturas se asignan a uniones exón-exón (EEJs) compatibles con al menos 5 lecturas y un valor de porcentaje empalmado (PSI) de al menos 5%. Se definieron exones nuevos como aquellos ausentes de las bases de datos de anotación y de todos los conjuntos de datos de control no perturbados (Fig. 1a). Confirmando la validez de este enfoque, la caída de la proteína de unión al ARN (RBP) ribonucleoproteína C heterogénea (hnRNPC) creó los eventos de exonización más derivados del Alu (archivo adicional 1: Figura S1), en línea con las observaciones anteriores . En total, detectamos 13,103 nuevos eventos exónicos dentro de 4774 genes o 30.,6% de los genes codificadores de proteínas humanas evaluados bajo las perturbaciones que encuestamos.
para investigar los mecanismos subyacentes a estos eventos de exonización, cotejamos una lista de características asociadas clásicamente con el empalme alternativo, incluida la fuerza del sitio de empalme, el contenido de GC y la longitud del tracto de polipirimidina (archivo adicional 2: Tabla S1)., Luego se utilizó la regresión lineal logística para comparar estos eventos con un grupo» de fondo » de intrones expresados que carecían de evidencia de exonización (Fig. 1b). Validando nuestra elección de características genómicas, nuestro modelo alcanza una alta tasa media positiva real del 75,2% (archivo adicional 1: Figura S1). Además, se pudo confirmar resultados previos de que los eventos de exonización tienden a ocurrir en intrones largos con un alto contenido de GC (archivo adicional 1: Figura S1, longitud de intrón: p < 3.53 × 10-59, GC 1.01 × 10-73, prueba T de Student)., Notably, we find exonization events often overlap nucleosome-binding sites (Additional file 1: Figure S1, P < 2.37 × 10-23, Wilcoxon test), rarely occur at the 3-end of the gene body (p < 5.90 × 10-21, Student t test) and show a significant tendency to occur within 5-utrs (archivo adicional 1: figura S1, p < 7.13 × 10-166, prueba exacta de Fisher). Es importante destacar que también observamos que el predictor más fuerte para la exonización fue la aparición de elementos transponibles que se superponen al exón Nuevo (Fig., 1b y archivo adicional 1: Figura S1, p < 6.46 × 10-127, prueba T de Student). En comparación con estos predictores fuertes, ningún elemento de empalme cis-Regulador contribuye significativamente al modelo o muestra diferencias significativas entre los conjuntos de Datos (archivo adicional 1: Figura S1, p > 0.05, prueba T de Student).
para evaluar la conservación del nuevo uso de exones en todas las especies, analizamos el alcance de la exonización en múltiples tipos de tejidos emparejados dentro de cuatro especies de primates que abarcan 30 millones de años de evolución de primates., Para explorar el uso de exonización entre muestras, los genes con eventos que ocurren en las cuatro especies se identificaron y clasificaron utilizando clustering de propagación de afinidad. En línea con el empalme canónico alternativo, las muestras de la misma especie invariablemente se agruparon juntas (archivo adicional 1: Figura S2). La excepción notable a esta tendencia se observó en muestras de los testículos, que mostraron agrupamiento específico del tejido. Esto sugiere que dentro de los testículos hay una fuerte firma de exonización conservada a través de especies de primates en múltiples genes (archivo adicional 1: Figura S2).,
para investigar más a fondo la influencia de los retrotransposones en la exonización, subdividimos los elementos transponibles en sus subfamilias principales. En línea con la especificidad del linaje de los eventos de exonización, los contribuyentes más significativos al modelo son los transposones menores de 70 millones de años. En particular, los miembros de la subfamilia de elementos Alu AluJ y AluS, así como los elementos L1 altamente móviles son predictores fuertes (Fig. 1c). Curiosamente, una excepción a esta regla es la AluY sub-familia , que muestra un patrón que recuerda mucho mayores transposón eventos (Fig. 1c)., Esta diferencia se debe potencialmente a su depleción relativa dentro de los cuerpos genéticos (3%, 19%, AluY, AluS, ocurrencia en intrones expresados). Finalmente, quisimos evaluar qué tipo de genes contiene eventos de Alu-exonización. Curiosamente, encontramos un fuerte enriquecimiento para las funciones relacionadas con la señalización celular y la regulación del ciclo celular (Fig. 1d, archivo adicional 1: Figura S1 y archivo adicional 3: Tabla S2). Junto con ejemplos anteriores, nuestra observación de un extenso número de eventos de exonización que se superponen con nuevos transposones sugiere una nueva fuente de complejidad transcriptómica.,
las proteínas de unión al ARN m6a suprimen la exonización
una evaluación de los factores trans que promueven la exonización (archivo adicional 1: Figura S2 y archivo adicional 4: Tabla S3) reveló un enriquecimiento de los RBPs de unión a m6a (n6-metiladenosina), especialmente entre exones nuevos que contienen Alu (Fig. 2a, p < 0,05, prueba hipermétrica). Esto incluyó hnRNPC, que se ha demostrado previamente para inducir un gran número de eventos de exonización Alu-específicos, así como el síndrome de DiGeorge región crítica 8 (DGCR8) y YTH dominio que contiene la proteína 2 (YTHDC2)., Para examinar el papel potencial de las marcas m6a en la exonización, analizamos los datos de derribo de la subunidad de la enzima de modificación m6a n6-adenosina-metiltransferasa (METTL3) . Este análisis reveló un aumento significativo en el número de eventos de exonización detectables tras la caída de METTL3 (Fig. 2b, p < 3.57 × 10-03, Wilcox-rank Sum test), en concordancia m6a regulando la inclusión de nuevos exones. El análisis posterior de estos eventos de exonización dependientes de METTL3 reveló un enriquecimiento funcional de genes asociados con el daño del ADN (p < 2.,68 × 10-02, valor de P corregido por FDR). A continuación, analizamos datos de células HeLa que constituyen dos derribos de reguladores M6A conocidos (factor de empalme rico en Serina/arginina 3 (SRSF3) y proteína 1 que contiene dominio YTH (YTHDC1)) y dos derribos de RBPs no conocidos para reconocer directamente m6a (factor de empalme rico en Serina/arginina 9 y 10 (SRSF9 y SRSF10)) . De acuerdo con los resultados anteriores, encontramos que el derribo de SRSF3 o YTHDC2 induce fuertemente la exonización, mientras que la disminución de la expresión de SRSF9 o SRSF10 tiene poco o ningún impacto (archivo adicional 1: Figura S2).,
para evaluar más a fondo si la modificación de m6a afecta a los eventos de exonización, evaluamos el enriquecimiento de los sitios m6a dentro de secuencias exoneradas . En este abordaje se utilizó BrU-seq seguido de aislamiento de fragmentos metilados de m6a utilizando un anticuerpo específico de m6a . Debido a la naturaleza repetitiva de los elementos Alu, utilizamos la maximización de expectativas para asignar lecturas multimapping (máximo de 10 coincidencias permitidas) a los elementos Alu basados en la expresión del gen del huésped ., Como conjunto de comparación, examinamos todos los elementos Alu dentro de regiones intrónicas expresadas que no están en la vecindad de un exón nuevo (ver la sección «Métodos»). Este análisis reveló un fuerte enriquecimiento del mapeo de sitios m6a a elementos Alu exonizados (Fig. 2c, p < 3.23 × 10-123, prueba de Wilcoxon rank-sum; Fig. 2d, p < 2.13 × 10-63, prueba de suma de rangos de Wilcoxon; archivo adicional 1: Figura S2). En conjunto, esto sugiere que la modificación de m6a y las proteínas de unión son reguladores clave de los eventos de exonización (que contienen Alu).,
mecanismos que aumentan la «ventana de oportunidad» para el reclutamiento de spliceosomas promueven la exonización
nuestro análisis inicial reveló que la predicción de exonización está fuertemente mejorada por elementos repetidos, longitud de intrón y contenido de GC. Se sabe que estas características se correlacionan negativamente con la tasa de elongación de la ARN polimerasa II (RNAPII). Por lo tanto, planteamos la hipótesis de que los cambios en la tasa de elongación de RNAPII pueden promover la exonización., Para probar esto, analizamos los datos de RNA-seq de células humanas que expresan mutaciones que aumentan (E1126G) o disminuyen (R749H) la tasa de elongación de la ARN polimerasa II (RNAPII) . Para determinar la tasa de elongación para cada mutante, analizamos los datos del ensayo de secuenciación nuclear de ejecución en todo el genoma (GRO-seq) combinado con el inhibidor de elongación de transcripción DRB (consulte la sección «Métodos» y ). Observamos que las mutaciones que ralentizan la tasa de elongación de RNAPII (R749H) inducen eventos de exonización fuertemente (Fig. 3a, todos: p < 3.,18 × 10−45, Fisher’s exact test), with this change especially strong in Alu-containing novel exons (Fig. 3a, ALU: p < 5.62 × 10−53, Fisher’s exact test). In contrast, mutations that speed up elongation had negligible effects on the number of exonization events detected (Fig. 3a; p > 0.05, Fisher’s exact test).
Este resultado apoya el modelo de competencia de empalme alternativo en el que la regulación de la inclusión de exones se asocia a una «ventana de oportunidad» para el reconocimiento del empalme. Si esta conexión entre la exonización y la oportunidad es válida, un mecanismo independiente para la aparición de nuevos exones debería ocurrir dentro de los intrones que son procesados lentamente por la maquinaria de empalme., Para evaluar esta hipótesis, analizamos los datos de ARN nacientes de BrU-Chase-seq, en el que las células se etiquetan con un pulso de BrU de 15 minutos y se persiguen durante 0, 15, 30 y 60 minutos. Para determinar la cinética de empalme para cada intrón, calculamos la dinámica de eficiencia de empalme (SEDs) o la tasa de escisión de intrón (consulte la sección «Métodos»). El agrupamiento de K-means se utilizó entonces para identificar cinco grupos de intrones con SEDs que iban de muy rápido a muy lento (archivo adicional 1: Figura S3). Los intrones que contenían eventos de exonización se compararon con un conjunto de antecedentes de todos los intrones expresados., Sorprendentemente, este análisis revela que los intrones que contienen eventos de exonización están fuertemente enriquecidos dentro del cúmulo SED más lento (Fig. 3b, p < 3.23 × 10-239, prueba de suma de rango de Wilcox, y archivo adicional 1: Figura S3). Además, estos intrones muestran una reducción muy significativa en el SED en comparación con los grupos de fondo (Fig. 3C y archivo adicional 1: Figura S3, p < 2.2 × 10-160, prueba de suma de Rango de Wilcoxon)., En conjunto, estas observaciones sugieren que los mecanismos que amplían la «ventana de oportunidad» aumentarán la probabilidad de reconocimiento por parte del mecanismo de empalme y, por lo tanto, promoverán la tasa de exonización.
el daño del ADN induce la exonización dentro de los genes del ciclo celular
El proceso exógeno también puede promover alteraciones en la elongación de la transcripción y, por lo tanto, puede alterar las tasas de exonización., Para investigar esto nos centramos en la irradiación UV, ya que estudios Anteriores han demostrado que promueve tanto la hiperfosforilación de RNAPII que conduce a la inhibición posterior de la elongación de la transcripción y el reclutamiento de la maquinaria m6a a sitios de daño del ADN . Utilizando datos obtenidos del naciente RNA-seq (protocolo GRO-SEQ), evaluamos el impacto de la irradiación UV en la ALU-exonización durante un período de 24 horas . Sorprendentemente, después de la pronunciada disminución en la tasa de elongación de RNAPII tras la irradiación UV, encontramos un aumento igualmente sorprendente en la tasa de exonización (Fig., 4A y archivo adicional 1: Figura S4). Esta incorporación de nuevos exones continúa aumentando mientras la tasa de elongación de RNAPII permanezca baja. Es importante destacar que la recuperación completa de la tasa de elongación de RNAPII en la marca de 24 horas está acompañada por una caída precipitada en el número de eventos de exonización detectables (Fig. 4A y archivo adicional 1: Figura S4).