Melissa Moore - U. masa / hhmi - Parte 1 - Genes de split y empalme de arn

Hola. Mi nombre es Melissa Moore y soy del Instituto Médico Howard Hughes y la escuela de Medicina de la Universidad de Massachusetts. Estoy aquí hoy para hablarles acerca de los genes divididos y la unión de ARN. La mayoría de Uds. están familiarizados con el dogma central de la biología que fue elaborado por Francis Crick en 1956. Lo que dice el dogma central es que el ADN se copia o se transcribe en ARN y después ese ARN se traduce a un idioma diferente que es el lenguaje de las proteínas. Así que uno de los principios claves del dogma central de la biología es que un gen codifica una proteína. Esto es muy cierto en las bacterias, donde si uno rompe y abre una célula bacteriana y extiende hacia fuera el ADN y el ARN, se puede ver muy claramente que aquí está el ADN, y mientras el ADN se transcribe en ARN, es unido por los ribosomas. Así pues, estas manchas negras grandes aquí son los poliribosomas y están haciendo proteínas. Así que el ARN se copia o se traduce directamente en proteínas. Aquí estoy mostrando una célula eucariota junto a una célula procariota. Estas son las bacterias al lado de un glóbulo blanco. Se puede ver que la célula blanca de la sangre es mucho, mucho más grande que la bacteria. Por eso, las células eucariotas son no sólo más grandes que las bacterias, sino que también son más complicadas internamente. Si ésta es la estructura bacteriana aquí abajo y ésa sería la estructura interna eucariótica, se puede ver que en la célula eucariota, el ADN está en el núcleo mientras que los ribosomas están aquí en el citoplasma, como se ve particularmente en el ER rugoso aquí. Por eso la gran diferencia de una célula eucariota es que el ADN no es accedido directamente por los ribosomas. También en la célula eucariota, éste es un gen que se está transcribiendo de esta dirección a ésa. Así que Uds. pueden ver que el ARN que sale del ADN es cada vez más largo mientras está siendo transcrito en esta dirección. Pero en algún momento se forman estas asas. De hecho, estas asas son intrones que se remueven durante la unión. Así que a diferencia de los genes procariotes, los genes eucariotes se dividen en la naturaleza. Tienen segmentos que deben ser removidos antes de que puedan ser usados para producir proteínas. Esta diapositiva muestra la actual perspectiva de la expresión de genes eucariotes. Los genes eucariotes se dividen, lo que significa que contienen secuencias que no están contenidas dentro del mARN final y que no se traducen en la secuencia de proteína. Esas secuencias se denominan intrones y están representados por la línea blanca aquí, y los exones son las pequeñas cajas de colores. Esas son las regiones expresadas. Cuando un gen es activado y transcrito, se transcribe primero en un ARN pre-mensajero o pre-mARN y ese pre-mARN se somete a varios pasos de procesamiento. En primer lugar, es cubierto con una tapa de metilguanosina 7. En el extremo 3' es escindido y luego se añade una cola poli-A. Luego, en el medio, estas secuencias de intrones son literalmente removidas. Hay tijeras moleculares y una cinta que hace el trabajo de empalmación pre-mARN. Después de que se realiza todo el procesamiento, el mARN migra al envoltorio nuclear, donde se exporta y es traducido en proteínas. Esto muestra la estructura de un típico gen humano. De modo que el gen humano típico tiene 23.000 pares de bases y 7 intrones. Ahora estoy usando una mediana aquí porque si uso el promedio, sería descolocado por algunos de los genes muy grandes de los que vamos a hablar dentro de poco. La otra cosa que Uds. notarán es que el gen humano típico tiene intrones 10 veces más largos que las longitudes de exones. Eso significa que cada vez que un gen humano se transcribe, 90-95% del ARN es inmediatamente removido y desechado. Eso parece un desperdicio. Así que vamos a hablar de por qué tenemos estas regiones intrónicas. ¿De qué sirven si estamos perdiendo tanto ARN? Pero antes de hablar de eso, quiero contarles sobre cierto gen gigantesco: el gen de la distrofina. La distrofina codifica una proteína que es necesaria para los músculos y las mutaciones en este gen son una de las causas de la distrofia muscular. El gen de la DMD es el segundo gen más grande en el genoma humano. Tiene 2,2 millones de pares de bases. Cuenta con 79 exones y 78 intrones y uno de esos intrones tiene 400.000 nucleótidos de longitud. Ahora, cuando digo esto es muy difícil para Uds. realmente tener una idea de la magnitud de esta cosa. Así que ahora voy a mostrar una pequeña película para que Uds. puedan realmente ver lo grande que es este gen. Aquí estamos con nuestro modelo a escala del gen de la distrofina que está representado por esta cuerda. Quiero que miren el extremo de esta cuerda. Las pequeñas cintas de colores aquí son los exones. La cuerda blanca es el intrón. Y se puede ver que aquí está el exón siguiente. Así que los intrones son mucho, mucho más largos que los exones. Ahora, para darles una idea de lo grande que es este gen, voy a fingir que soy el ARN polimerasa. Empiezo la transcripción de este gen cuando te levantas por la mañana. Este es el punto de tiempo del desayuno aquí. Así que ahí voy. Aquí está el ARN polimerasa. Estoy transcribiendo este gen. No es tarde. Todavía estamos en la mañana. Aquí está nuestra merienda de media mañana. Así que estamos todavía en marcha. La polimerasa es increíblemente procesiva en este gen. Ni siquiera hemos recorrido aún un millón de pares de bases. Ahora estamos a mitad de camino en los genes, así que es hora de almuerzo. La polimerasa sigue transcribiendo este gen. Todavía estamos en marcha, aún en marcha. Aquí estamos en la mitad de la tarde. Estamos entrando en la cena ahora. Hemos pasado trece o catorce horas. Finalmente, cuando estás a punto de ir a la cama después de 16 horas, llegamos al final del gen, al último exón. La polimerasa se demoró 16 horas en transcribir este gen de la distrofina. Bueno, así que acabamos de ver lo largo que es el ARN de la distrofina. Y les puedo decir que era una cuerda de 99,4 metros de altura. Ahora, una vez todos esos intrones son removidos, a escala, éste es el tamaño del ARN mensajero. Este ARN mensajero es muy largo. Se trata de un ARN mensajero de 17.000 bases. Pero es menos de 1% del ARN original que fue transcrito. Es realmente asombroso. Así que ahora vamos a hablar de por qué tenemos todos estos intrones. En realidad es increíble que tengamos tanto ADN que es aparentemente basura, que se copia en el ARN y luego es inmediatamente desechado. ¿De qué sirven estos intrones? Una cosa que los intrones hacen para nosotros es permitir que las células eucariotas evolucionen nuevos genes fácilmente. Pueden evolucionar nuevos genes por la duplicación de los exones. Así que vamos a tomar, por ejemplo, la proteína fibronectina. Se puede ver aquí que la fibronectina se compone de muchas repeticiones de dominios diferentes. Estos dominios también se encuentran en otras proteínas. Por ejemplo, el dominio de color amarillo se encuentra en receptores de la superficie celular y otras proteínas de matriz extracelular. El dominio azul se encuentra en las proteínas de coagulación de la sangre y el dominio rojo también se encuentra en TPA, o activador del plasminógeno tisular. Así que la fibronectina se crea cuando tomamos todos estos diferentes dominios, los enganchamos y los traemos de otros lugares. La forma en que que se puede hacer esto es que si nos fijamos ahora en este diagrama del gen de la fibronectina, se puede ver que cada uno de estos dominios se compone de uno o dos exones. Por lo tanto, la ventaja de tener intrones en este caso es que por la recombinación no homóloga, grandes trozos del genoma pueden ser movidos de un lugar a otro y no necesariamente tienen que estar conectados perfectamente porque la maquinaria de empalme los conecta. En cambio, en las bacterias, donde no hay intrones, si hay un evento de recombinación no homóloga para hacer una nueva proteína, entonces tiene que estar perfectamente en el marco y es mucho más difícil de hacer, ya que no es el espacio genético apropiado para la recombinación. Así que ésa una ventaja de tener intrones. Ahora, vamos a hablar de la segunda ventaja importante el examinar el problema del número de genes vs. su complejidad. Así que pensemos en cuántos genes tienen los diferentes organismos. Así que aquí, por ejemplo, está E. coli, una bacteria, y S. cerevisiae, la levadura de gemación, o la levadura que se utiliza para hacer pan o cerveza. E. coli es una bacteria en el intestino. Ahora, ya hemos demostrado que las bacterias son mucho más simples que las células eucariotas, por lo que se podría esperar que E. coli no tenga tantos genes como S. cerevisiae y eso es cierto. E. coli tiene cerca de 3.200 genes y S. cerevisiae tiene unos 6.000 genes. Cuando hablo de genes aquí, me refiero a los genes que codifican proteínas. Ahora bien, si ascendemos en la escala evolutiva, vamos a considerar dos organismos modelo: C. elegans, o la lombriz, y Drosophila melanogaster, la mosca de la fruta. Ahora, en la superficie puede parecer que Drosophila es el organismo más complicado, por lo que tendría más genes que la lombriz intestinal, pero en realidad es al revés. C. elegans tiene unos 19.000 genes y Drosophila melanogaster sólo tiene unos 13.000 genes. Así que ahora Uds. tienen que preguntarse: ¿cuánto más complicado soy yo en comparación con una mosca de la fruta o una lombriz? ¿Cuántos genes pensamos que tienen los seres humanos? O los seres humanos, los ratones e incluso una planta de mostaza, algo que podría ser un poco más complicado que una lombriz. Por lo tanto, si una lombriz tiene 19.000 genes, antes de que el genoma humano fuese secuenciado, la gente pensaba que los seres humanos tienen alrededor de 100.000 genes. La gran sorpresa ha sido que, de hecho, todos estos organismos tienen aproximadamente el mismo número de genes, alrededor de 25.000. Así que realmente no es un número muy grande. Y si sólo tomamos eso en cuenta, somos sólo dos veces más complicados que la mosca de la fruta o aproximadamente 1,3 veces más que las lombrices intestinales. En cierto modo es preocupante. Entonces, ¿cómo podemos vivir así? Bueno, la forma en que vivimos con esta aparente falta de complejidad es el empalme alternativo. Los eucariotas, además de tener genes divididos, desafían el dogma central de la biología, el original dogma central de la biología. Es decir, podemos tener un gen, pero un gen puede hacer muchas, muchas proteínas. Por ejemplo, aquí hay un gen, donde si todos los exones son empalmados, entonces se hace una proteína, pero si el exón rojo se dejó fuera, se hace una proteína diferente. Luego aquí, el éxon azul, el exón 4, se deja fuera y se hace una tercera proteína. Así que en este gen particular, hay tres proteínas procedentes de un gen. Ahora sabemos por los recientes esfuerzos con la secuenciación profunda que alrededor del 95% de todos los genes humanos exhiben el empalme alternativo. Eso significa que nuestro proteoma, el número de proteínas que tenemos, es mucho, mucho más grande que nuestro genoma. Hay muchos tipos diferentes de empalme alternativo. Por lo tanto, pueden haber promotores alternativos, que están en el comienzo del gen. Pueden haber sitios poli-A alternativos. Así que ese es el extremo 3' del gen. Sitios alternativos de empalme de 5'. Vamos a hablar de lo que es un sitio de empalme 5' en un minuto, pero es el comienzo de un intrón. Sitios alternativos de empalme de 3'. Luego están los exones llamados exones de cassette que son empalmados para adentro o para fuera. Ese es el ejemplo que les mostré hace un minuto. Y hay exones mutuamente excluyentes, donde un exón se coloca u otro, pero no ambos. Y luego, por supuesto, la forma más simple de empalme alternativo es no empalmar en absoluto. Así que se puede empalmar o no empalmar y eso sería un intrón retenido. Así que hay muchos tipos diferentes de empalme alternativo. El tipo más común de empalme alternativo es el exón cassette, donde un exón es empalmado para dentro o para fuera. Ahora, ¿cuántas proteínas diferentes se pueden hacer a partir de un gen? Este es el gen alfa tropomiosina de rata y éstas son algunas de las formas de empalme del gen alfa tropomiosina. Así que pueden ver que hay muchas formas diferentes de empalme en los fibroblastos. Son células esencialmente no diferenciadas. Y aquí hay otras isoformas en el cerebro y el músculo liso. Una de las cosas importantes acerca del empalme es que puede ser controlado en términos del desarrollo y los tejidos. Así que un gen en un tejido podría hacer una proteína, pero en otro tejido produce una proteína muy diferente. Es como añadir complejidad. ¿Qué tan complejo puede ser? Bueno, aquí está el actual poseedor del récord. Así que éste es el gen de Drosophila, DSCAM, que está implicado en la orientación axonal en el cerebro. Y Drosophila DSCAM tiene tres regiones de exones mutuamente excluyentes. Así que hay uno aquí, uno aquí, uno aquí y otro allí. Esta región tiene 48, 33. Hay 2 allí y hay 12 aquí. Así que si lo calculamos, hay más de 38.000 diferentes isoformas empalmadas posibles del gen Dscam. Según lo que sabemos, todas estas isoformas se pueden hacer. Eso significa que este gen en Drosophila puede hacer tres veces más proteínas diferentes de los genes que hay en el genoma de Drosophila. Así que es muy probable que en eucariotas superiores, como tú y yo, nuestro proteoma tiene más de cientos de miles o millones de proteínas diferentes. Así que con eso en mente, ahora vamos a mirar hacia atrás en nuestro problema de la complejidad. Pero esta vez, en vez de mirar los genes, veamos cuántos intrones tiene cada organismo y cómo eso aumenta con la complejidad. Por ejemplo, en E. coli, que no tiene intrones. Los procariotes no tienen este tipo de intrones. S. cerevisiae, o la levadura de gemación, tiene unos pocos intrones. Sólo tiene unos 250 intrones y cuando subimos la escala evolutiva, la lombriz tiene cerca de 99.000 intrones, de nuevo, más que la mosca de la fruta, simplemente porque tiene más genes. Pero a medida que avanzamos hacia los seres humanos y los ratones, se puede ver que el número de intrones está subiendo dramáticamente. Y como el número de proteínas que puedes hacer crece digamos exponencialmente según el número de intrones, se puede imaginar que nuestros proteomas pueden ser mucho más complicados que los de otros organismos. Ahora queremos hablar sobre el problema de qué hace que la célula sepa dónde están los intrones. En otras palabras, ¿cómo sabe dónde empalmar? En este sentido, una célula se enfrenta con el mismo problema que el director de cine, que ha filmado durante horas y sin embargo ahora está abrumado con la cantidad de filme y tiene que hacer una película final. Por eso, tradicionalmente, antes del era digital, el director de cine revisaba la película cuadro por cuadro, encontraba exactamente el lugar donde quería hacer un corte y luego habría una máquina de empalme que literalmente cortaba y empalmaba la película de nuevo para hacer la versión final. En las células, eso es exactamente lo que sucede. Porque por supuesto, los intrones se componen de nucleótidos individuales y los nucleótidos son muy similares a los cuadros individuales en una película. Así que los intrones tienen la siguiente estructura. El extremo 5', o el comienzo del intrón, es muchas veces llamado un donante empalmado pero los empalmadores tienden a llamarlo el sitio de empalme de 5'. En 99% de los genes, se expresa mediante un GT como los dos primeros nucleótidos del intrón. Luego, mucho más abajo, en realidad cerca del otro extremo del intrón, hay una adenosina llamada el sitio de la ramificación y vamos a hablar de lo que hace el sitio de la ramificación en la segunda parte de mi conferencia. Luego al final del intrón está el AG, que son los dos últimos nucleótidos del intrón en el sitio de empalme 3' o el "aceptor de empalme". Ahora, les he dicho que algunos intrones tienen hasta 400.000 nucleótidos de longitud y ciertamente esta cantidad de información no es suficiente para significar incluso un pequeño intrón. Así que debe haber secuencias adicionales. Además de estos nucleótidos universalmente conservados, hay secuencias de consenso en todos los intrones. Así que aquí hay secuencias de consenso para la levadura en ciernes y éstas se llaman logos, logotipos de motivo, y la altura de la letra nos dice qué tan conservado es ese sitio. Por ejemplo, aquí se puede ver el GT en el sitio de empalme 5', así que además del GT, hay varios otros nucleótidos que están altamente conservados y unos pocos que son menos conservados. En el sitio de ramificación en la levadura, hay una secuencia TACTAAC muy altamente conservada y luego aguas arriba del sitio de empalme 3', no hay demasiada conservación hasta que llegues al sitio de empalme 3'. Así que hay información adicional en estas secuencias llamadas de consenso. Asombrosamente, en los seres humanos...si se acuerdan, la levadura sólo tiene alrededor de 250 intrones y por lo general son cortos, todos tienen menos de unos cuantos cientos de nucleótidos, mientras que los intrones humanos son mucho, mucho más largos. Lo sorprendente es que las secuencias de consenso humanas son menos conservadas. Así que ya pueden ver eso porque pueden ver que hay muchas más letras aquí abajo que hay aquí arriba, particularmente para el sitio de ramificación, mucha menos conservación. Entonces, para el sitio de empalme 3', hay un poco más de información porque está esta pista llamada pirimidina aquí, que es un manojo de C y T de aguas arriba del AG. Ahora podemos cuantificar la cantidad de información que hay en estas secuencias mediante la terminología que es utilizada en la informática: los bits de información. Entonces, ¿cuánto contenido de información tienen estas cosas? Chris Burge y sus colaboradores realizaron un estudio sobre varios intrones muy cortos, los intrones más cortos en los seres humanos y también los intrones en la levadura. Ellos derivaron estas secuencias de consenso y estas secuencias de consenso tienen esta cantidad de información. Así que ya se puede ver con sólo mirar el número de bits que los intrones humanos tienen menos información en sus secuencias de consenso que los intrones de levadura, a pesar de que los intrones humanos, hay muchos más de ellos y son mucho más largos. Ahora bien, si sumamos toda esta información, las secuencias de intrones de levadura claramente tienen más información en sus secuencias de consenso que los seres humanos. Pero puedo decirles que lo que Chris Burge y sus colegas predijeron en este documento es que en los seres humanos, para especificar un intrón únicamente, incluso de este tamaño corto que estaban mirando, mucho menos que un millar de nucleótidos, en ese caso se necesitan cerca de 37 bits de información, y sin embargo sólo 23 bits de información están contenidos en las secuencias de consenso del sitio de empalme. Entonces, ¿dónde está esa otra información que viene? Así que del mismo trabajo, aquí hay un gráfico que muestra las contribuciones relativas de las características de los intrones al reconocimiento de los intrones en diferentes organismos, y éstos son los mismos organismos que vimos antes en términos de la cantidad de genes e intrones y la complejidad. Lo que se puede ver es que en S. cerevisiae toda la información proviene del sitio de empalme 5', el sitio de empalme 3' y las secuencias de consenso del sitio de ramificación. Pero cuando llegamos al ser humano, sólo la mitad de la información necesaria para especificar un intrón en los seres humanos procede de las tres secuencias de consenso. Parte de la otra información es la longitud. La composición de los intrones. Son algo diferentes en su composición de base en comparación con los exones. Pero luego está este gran cuadrante gris y uno tiene que preguntarse: ¿qué es esta otra información que requieren los intrones humanos? Encontramos una pista muy temprano, poco después de que los intrones fueron descubiertos. Este trabajo es de 1983. Los intrones fueron descubiertos en 1977. Los laboratorios de Maniatis y Orkin estaban siguiendo las mutaciones en el gen de la beta-globina. Las mutaciones en beta-globina causan una enfermedad llamada beta-talasemia. Es una enfermedad de la sangre muy debilitante, ya que no haces suficiente hemoglobina. Lo que encontraron fue que muchas de las mutaciones que causan beta-talasemia son mutaciones en la secuencia de consenso del sitio de empalme 5' del gen de la globina. Pero en lugar de matar completamente el empalme del gen de la beta-globina, lo que estas mutaciones hacen es activar los crípticos sitios de empalme 5' en la zona cercana. Eso significa que algo le dijo a la maquinaria de empalme que debería haber un sitio de empalme 5' en esta región, y aunque esta secuencia de consenso se mutó, había otras secuencias cercanas que podrían servir como un sitio de empalme 5' alternativo y viable. Entonces, ¿qué es esa otra información? Para pensar en qué puede ser esa información, vamos a echar un vistazo a ese modelo del gen de la distrofina que vimos. Si Uds. recuerdan, aquí está mi larga cuerda de 99 pies y cuando están mirando la cuerda, probablemente se fijan en los exones, las pequeñas piezas de color, y no en la propia cuerda. En realidad se puede pensar en un gen humano como islas de exones en el medio de océanos de intrones. Como en un mapa del Océano Pacífico si vas a identificar las islas, vas a fijarte en ellas, no en los extremos de los océanos. Vas a ver dónde comienzan y terminan las islas, no dónde se inicia y termina el mar. Así que vamos a pensar sobre cómo se podría aplicar esto a un gen humano. Lo que ahora entendemos es que los intrones y exones se reconocen en los genes humanos a través de lo que llamamos la definición de exones. Aunque los intrones son de longitud muy variable -- desde unos cientos de nucleótidos hasta decenas de miles o cientos de miles de nucleótidos -- los exones tienden a ser mucho más uniformes en su longitud. El exón promedio, como dijimos, es de 123 nucleótidos, pero varían en longitud desde aproximadamente 25 nucleótidos. (Hay algunos un poco más cortos. Hay excepciones a cada regla.) Pero en general, 25-300 nucleótidos es el tamaño de un éxon interno de un gen humano. Lo que busca la maquinaria de empalme humano es un buen partido para el sitio del consenso y ramificación y para el sitio de empalme 3', seguido de 25-300 nucleótidos por un buen partido con el sitio de empalme 5'. Eso entonces define a un exón. Pero incluso con esa información de distancia entre un sitio de empalme 3' y un sitio de empalme 5' aguas abajo, eso aún no es información suficiente para identificar a un exón y tampoco es suficiente para permitir el empalme alternativo de ese exón. Así que además de las secuencias de consenso, también hay otras secuencias llamadas potenciadores exónicos de empalme o silenciadores de empalme. Así que estos potenciadores o silenciadores pueden estar tanto en el exón como en los intrones. Si están en intrones se llaman potenciadores intrónicos de empalme o silenciadores intrónicos de empalme. Así que serían las secuencias ESE, ISE, ESS e ISS. Ahora bien, estas secuencias tienden a agruparse alrededor de los exones y son reconocidas por dos tipos diferentes de proteínas en general. Estas proteínas se llaman SR y hnRNP. Ahora, las proteínas SR son proteínas que se unen al ARN y tienen un dominio C-terminal que es rico en dipéptidos de arginina/serina. Las proteínas hnRNP son otro conjunto de proteínas que se unen al ARN. No tienen esa región RS. Pero, en general, las proteínas SR tienden a reconocer a los potenciadores de empalme. Tienden a aumentar el empalme y las proteínas hnRNP tienden a reconocer a los silenciadores de empalme, así que tienden a inhibir el empalme. Es el equilibrio de las proteínas SR y hnRNP que están en una célula lo que determina el patrón de empalme para cualquier ARN particular. Así que Uds. pueden pensar en las decisiones de empalme como decisiones de comité. Además de las proteínas SR y hnRNP, está la maquinaria de empalme central y vamos a hablar de eso en la segunda parte de mi charla. Sin embargo, el núcleo de la maquinaria de empalme es lo que es responsable de reconocer a las secuencias de consenso en los sitios de empalme. Luego al mismo tiempo, estarían estas proteínas SR y hnRNP, y entonces es la conjunción de todos estos factores diferentes que luego toma la decisión de si un exón se va a utilizar o no y si se convertirá en ARNm. Así que una cosa que me gustaría señalar sobre estas secuencias potenciadores y silenciadoras de empalme es que las mutaciones en las secuencias pueden dar lugar a enfermedades genéticas humanas. Aproximadamente el 20% de la enfermedad genética humana está causada por errores en el empalme. Estos errores pueden ocurrir si se produce una mutación en una de las secuencias de consenso -- ya lo hemos visto para los genes de beta-talasemia -- o cuando se produce una mutación en una de las secuencias silenciadores o potenciadoras. Un error común que se hace cuando los científicos están buscando las mutaciones que causan una enfermedad en particular, es que si se encuentra una mutación en un exón de codificación y la mutación cambia el aminoácido codificado por ese exón, a menudo se supone que esa mutación tiene sus efectos perjudiciales mediante el cambio de un aminoácido en la proteína. Pero de hecho, muchas veces la mutación puede cambiar el patrón de empalme. Por ejemplo, dejar fuera un exón entero o cambiar un sitio de empalme sería mucho más perjudicial. Así que es importante pensar en eso si estás buscando las mutaciones que causan un trastorno particular en los seres humanos o algún otro organismo modelo. También es importante tener en cuenta que no podemos pasar por alto las mutaciones en los intrones. Además de que las mutaciones en las secuencias de consenso van a ser perjudiciales para el empalme, las mutaciones en estos silenciadores y potenciadores intrónicos de empalme también pueden cambiar el patrón. Así que en el futuro, vamos a tener que secuenciar tanto intrones como exones cuando estamos en busca de mutaciones en la enfermedad humana. Así que aquí están algunos ejemplos de esos tipos de mutaciones. En la parte superior aquí, tenemos el gen SMN. Ahora, todos nosotros tenemos dos copias de este gen: está SMN1 y SMN2. Si tienes una mutación en SMN1, de tal manera que se interrumpe, es un problema porque el gen SMN2 es idéntico al gen SMN1 excepto que tiene una mutación T en un potenciador exónico de empalme, de tal manera que en el gen SMN1 se incluye todo el exón 7, pero en SMN2 se incluye sólo 20% del exón 7. Así que si careces del gen SMN1, entonces no produces suficiente proteína SMN y los niños que no producen una suficiente cantidad de esta proteína tienen problemas con el desarrollo de sus neuronas motoras y tienen atrofia muscular espinal. Aquí hay otro ejemplo. La distrofina es una mutación que provoca un codón de parada. Así que uno podría asumir que el problema es que produce una proteína truncada. Pero de hecho esta mutación de parada, esta mutación sin sentido, está en un silenciador exónico de empalme, o se convierte en un silenciador exónico de empalme de tal manera que el exón se queda afuera. Todavía hace esa proteína, pero carece de ese exón. Luego, éste es un tercer ejemplo. Los pacientes que sufren de demencia frontotemporal a menudo tienen una mutación en el gen tau. Esa mutación vuelve más fuerte a un potenciador exónico de empalme, de tal manera que hace más de la versión de la proteína que incluye el exón 10 y menos de la que lo excluye. Esta relación 50/50 es muy importante para tener cantidades normales de la proteína tau. Así pues, en este caso, los pacientes están sobreexpresando esta forma truncada de la proteína y eso conduce a la demencia frontotemporal. Finalmente, me gustaría dejarlos con algunos mensajes para llevar a casa. El primero es que los genes eucariotas contienen intrones. No todos los genes eucariotas contienen un intrón, pero sin duda en la gran mayoría de los seres humanos, los genes contienen intrones. Estos intrones facilitan la evolución de nuevos genes y al permitir el empalme alternativo, nos permiten aumentar considerablemente la complejidad de nuestro proteoma. Los eucariotes superiores utilizan la definición de exón para definir sitios de empalme porque los exones son como islas en océanos del intrones. Por último, muchas enfermedades humanas hereditarias son causadas por mutaciones que afectan la inclusión de los exones o la elección del sitio de empalme. Así termina esta parte de la conferencia. Si Uds. están interesados en aprender algo sobre la maquinaria que elimina los intrones, vean mi próxima conferencia, que es sobre la estructura y la dinámica de los espliceosomas. Gracias.