Tip:
Highlight text to annotate it
X
Hola. Mi nombre es Melissa Moore
y soy del Instituto Médico Howard Hughes
y la escuela de Medicina de la Universidad de Massachusetts.
Estoy aquí hoy para hablarles acerca de los genes divididos
y la unión de ARN.
La mayoría de Uds. están familiarizados con el dogma central de la biología
que fue elaborado por Francis Crick en 1956.
Lo que dice el dogma central es que el ADN se copia
o se transcribe en ARN y después ese ARN se traduce
a un idioma diferente que es el lenguaje de las proteínas.
Así que uno de los principios claves del dogma central de la biología
es que un gen codifica una proteína.
Esto es muy cierto en las bacterias, donde si uno
rompe y abre una célula bacteriana y extiende hacia fuera el ADN y el ARN,
se puede ver muy claramente que aquí está el ADN,
y mientras el ADN se transcribe en ARN, es
unido por los ribosomas. Así pues, estas manchas negras grandes aquí
son los poliribosomas y están haciendo proteínas.
Así que el ARN se copia o se traduce directamente en proteínas.
Aquí estoy mostrando una célula eucariota junto a una célula procariota.
Estas son las bacterias al lado de un glóbulo blanco.
Se puede ver que la célula blanca de la sangre es mucho,
mucho más grande que la bacteria. Por eso, las células eucariotas
son no sólo más grandes que las bacterias, sino que también
son más complicadas internamente.
Si ésta es la estructura bacteriana aquí abajo y ésa sería
la estructura interna eucariótica, se puede ver
que en la célula eucariota, el ADN está en el núcleo
mientras que los ribosomas están aquí en el citoplasma,
como se ve particularmente en el ER rugoso aquí.
Por eso la gran diferencia de una célula eucariota es que
el ADN no es accedido directamente por los ribosomas.
También en la célula eucariota, éste es un gen que se está transcribiendo
de esta dirección a ésa. Así que Uds. pueden ver
que el ARN que sale del ADN es cada vez más largo
mientras está siendo transcrito en esta dirección. Pero en algún momento
se forman estas asas. De hecho, estas asas
son intrones que se remueven durante la unión. Así que a diferencia de los genes procariotes,
los genes eucariotes se dividen en la naturaleza. Tienen segmentos
que deben ser removidos antes de que puedan
ser usados para producir proteínas. Esta diapositiva muestra la
actual perspectiva de la expresión de genes eucariotes.
Los genes eucariotes se dividen, lo que significa
que contienen secuencias que no están contenidas dentro del
mARN final y que no se traducen en
la secuencia de proteína. Esas secuencias se denominan intrones
y están representados por la línea blanca aquí, y
los exones son las pequeñas cajas de colores. Esas son las
regiones expresadas. Cuando un gen es activado y
transcrito, se transcribe primero en
un ARN pre-mensajero o pre-mARN y ese pre-mARN
se somete a varios pasos de procesamiento.
En primer lugar, es cubierto con una tapa de metilguanosina 7.
En el extremo 3' es escindido y luego se añade una cola poli-A.
Luego, en el medio, estas secuencias de intrones son literalmente
removidas. Hay tijeras moleculares y una cinta
que hace el trabajo de empalmación pre-mARN. Después de que se realiza todo
el procesamiento, el mARN migra al envoltorio nuclear,
donde se exporta y es traducido
en proteínas. Esto muestra la estructura de un típico
gen humano. De modo que el gen humano típico tiene 23.000
pares de bases y 7 intrones. Ahora estoy usando una mediana aquí
porque si uso el promedio, sería
descolocado por algunos de los genes muy grandes de los que
vamos a hablar dentro de poco. La otra cosa
que Uds. notarán es que el gen humano típico
tiene intrones 10 veces más largos que
las longitudes de exones. Eso significa que cada vez que un
gen humano se transcribe, 90-95% del ARN
es inmediatamente removido y desechado. Eso
parece un desperdicio. Así que vamos a hablar de
por qué tenemos estas regiones intrónicas.
¿De qué sirven si estamos perdiendo tanto ARN?
Pero antes de hablar de eso, quiero contarles sobre
cierto gen gigantesco: el gen de la distrofina.
La distrofina codifica una proteína que es necesaria
para los músculos y las mutaciones en este gen son una
de las causas de la distrofia muscular. El gen de la DMD
es el segundo gen más grande en el genoma humano. Tiene
2,2 millones de pares de bases. Cuenta con 79 exones y 78 intrones
y uno de esos intrones tiene 400.000 nucleótidos de longitud.
Ahora, cuando digo esto es muy difícil para Uds.
realmente tener una idea de la magnitud de esta cosa.
Así que ahora voy a mostrar una pequeña película para que
Uds. puedan realmente ver lo grande que es este gen.
Aquí estamos con nuestro modelo a escala del gen de la distrofina
que está representado por esta cuerda. Quiero que
miren el extremo de esta cuerda. Las pequeñas cintas de colores
aquí son los exones. La cuerda blanca es el
intrón. Y se puede ver que aquí está el exón siguiente.
Así que los intrones son mucho, mucho más largos que los exones.
Ahora, para darles una idea de lo grande que es este gen,
voy a fingir que soy el ARN polimerasa.
Empiezo la transcripción de este gen cuando te levantas por la mañana.
Este es el punto de tiempo del desayuno aquí. Así que ahí voy.
Aquí está el ARN polimerasa. Estoy transcribiendo este gen.
No es tarde. Todavía estamos en la mañana. Aquí está nuestra merienda de media mañana.
Así que estamos todavía en marcha. La polimerasa es increíblemente procesiva en este gen.
Ni siquiera hemos recorrido aún un millón de pares de bases.
Ahora estamos a mitad de camino en los genes, así que es
hora de almuerzo. La polimerasa sigue transcribiendo este gen.
Todavía estamos en marcha, aún en marcha. Aquí estamos en la mitad de la tarde.
Estamos entrando en la cena ahora. Hemos
pasado trece o catorce horas. Finalmente,
cuando estás a punto de ir a la cama después de 16 horas,
llegamos al final del gen, al último exón.
La polimerasa se demoró 16 horas en transcribir este
gen de la distrofina.
Bueno, así que acabamos de ver lo largo que es
el ARN de la distrofina. Y les puedo decir que era una cuerda de 99,4 metros de altura.
Ahora, una vez todos esos intrones son removidos, a escala,
éste es el tamaño del ARN mensajero. Este ARN mensajero
es muy largo. Se trata de un ARN mensajero de 17.000 bases.
Pero es menos de 1% del ARN original que fue transcrito.
Es realmente asombroso.
Así que ahora vamos a hablar de por qué
tenemos todos estos intrones. En realidad es
increíble que tengamos tanto ADN que es aparentemente basura,
que se copia en el ARN y luego es inmediatamente desechado.
¿De qué sirven estos intrones? Una cosa que los intrones
hacen para nosotros es permitir que las células eucariotas evolucionen nuevos
genes fácilmente. Pueden evolucionar nuevos genes por
la duplicación de los exones. Así que vamos a tomar, por ejemplo,
la proteína fibronectina. Se puede ver aquí que la fibronectina
se compone de muchas repeticiones de dominios diferentes.
Estos dominios también se encuentran en otras proteínas.
Por ejemplo, el dominio de color amarillo se encuentra en receptores
de la superficie celular y otras proteínas de matriz extracelular.
El dominio azul se encuentra en las proteínas de coagulación de la sangre
y el dominio rojo también se encuentra en TPA, o activador del plasminógeno tisular.
Así que la fibronectina se crea cuando tomamos
todos estos diferentes dominios, los enganchamos y
los traemos de otros lugares. La forma en que
que se puede hacer esto es que si nos fijamos ahora en
este diagrama del gen de la fibronectina, se puede ver que
cada uno de estos dominios se compone de uno o dos exones.
Por lo tanto, la ventaja de tener intrones en este caso es que
por la recombinación no homóloga, grandes trozos del
genoma pueden ser movidos de un lugar a otro
y no necesariamente tienen que estar conectados perfectamente
porque la maquinaria de empalme los conecta.
En cambio, en las bacterias, donde no hay intrones,
si hay un evento de recombinación no homóloga para
hacer una nueva proteína, entonces tiene que estar perfectamente en el marco
y es mucho más difícil de hacer, ya que no es el
espacio genético apropiado para la recombinación.
Así que ésa una ventaja de tener intrones.
Ahora, vamos a hablar de la segunda ventaja importante
el examinar el problema del número de genes vs. su complejidad.
Así que pensemos en cuántos genes tienen los diferentes
organismos. Así que aquí, por ejemplo, está E. coli, una bacteria,
y S. cerevisiae, la levadura de gemación, o la levadura que se
utiliza para hacer pan o cerveza. E. coli es una bacteria
en el intestino. Ahora, ya hemos demostrado que las bacterias
son mucho más simples que las células eucariotas, por lo que se podría
esperar que E. coli no tenga tantos genes como S. cerevisiae
y eso es cierto. E. coli tiene cerca de 3.200 genes y
S. cerevisiae tiene unos 6.000 genes. Cuando hablo de genes
aquí, me refiero a los genes que codifican proteínas.
Ahora bien, si ascendemos en la escala evolutiva, vamos a considerar
dos organismos modelo: C. elegans, o la lombriz,
y Drosophila melanogaster, la mosca de la fruta. Ahora, en la
superficie puede parecer que Drosophila es el organismo más
complicado, por lo que tendría más genes
que la lombriz intestinal, pero en realidad es al revés.
C. elegans tiene unos 19.000 genes y
Drosophila melanogaster sólo tiene unos 13.000 genes.
Así que ahora Uds. tienen que preguntarse: ¿cuánto más
complicado soy yo en comparación con una mosca de la fruta o una lombriz?
¿Cuántos genes pensamos que tienen los seres humanos?
O los seres humanos, los ratones e incluso una planta de mostaza,
algo que podría ser un poco más complicado
que una lombriz. Por lo tanto, si una lombriz tiene 19.000 genes,
antes de que el genoma humano fuese secuenciado, la gente
pensaba que los seres humanos tienen alrededor de
100.000 genes. La gran sorpresa ha sido que, de hecho,
todos estos organismos tienen aproximadamente el mismo número
de genes, alrededor de 25.000. Así que realmente
no es un número muy grande. Y si sólo tomamos eso en cuenta,
somos sólo dos veces más complicados que la mosca de la fruta o
aproximadamente 1,3 veces más que las lombrices intestinales. En cierto modo es preocupante.
Entonces, ¿cómo podemos vivir así? Bueno, la forma en que
vivimos con esta aparente falta de complejidad es
el empalme alternativo. Los eucariotas, además de
tener genes divididos, desafían el dogma central de la
biología, el original dogma central de la biología.
Es decir, podemos tener un gen, pero un gen puede
hacer muchas, muchas proteínas. Por ejemplo, aquí
hay un gen, donde si todos los exones son empalmados,
entonces se hace una proteína, pero si el exón rojo se dejó
fuera, se hace una proteína diferente. Luego aquí, el éxon azul,
el exón 4, se deja fuera y se hace una tercera proteína.
Así que en este gen particular, hay tres proteínas
procedentes de un gen. Ahora sabemos por los recientes
esfuerzos con la secuenciación profunda que alrededor del 95% de todos los genes humanos
exhiben el empalme alternativo. Eso significa que
nuestro proteoma, el número de proteínas que tenemos,
es mucho, mucho más grande que nuestro genoma.
Hay muchos tipos diferentes de empalme alternativo.
Por lo tanto, pueden haber promotores alternativos, que están
en el comienzo del gen. Pueden haber sitios poli-A alternativos.
Así que ese es el extremo 3' del gen. Sitios alternativos de empalme
de 5'. Vamos a hablar de lo que es un sitio de empalme 5'
en un minuto, pero es el comienzo de un intrón.
Sitios alternativos de empalme de 3'. Luego están los exones
llamados exones de cassette que son empalmados para adentro
o para fuera. Ese es el ejemplo que les mostré hace un
minuto. Y hay exones mutuamente excluyentes,
donde un exón se coloca u otro, pero no ambos.
Y luego, por supuesto, la forma más simple de empalme alternativo
es no empalmar en absoluto. Así que se puede empalmar o no
empalmar y eso sería un intrón retenido. Así que hay
muchos tipos diferentes de empalme alternativo. El
tipo más común de empalme alternativo es el
exón cassette, donde un exón es empalmado para dentro o para fuera.
Ahora, ¿cuántas proteínas diferentes se pueden hacer a partir de
un gen? Este es el gen alfa tropomiosina de rata
y éstas son algunas de las formas de empalme del
gen alfa tropomiosina. Así que pueden ver
que hay muchas formas diferentes de empalme en los fibroblastos.
Son células esencialmente no diferenciadas.
Y aquí hay otras isoformas en el cerebro y el músculo liso.
Una de las cosas importantes acerca del empalme
es que puede ser controlado en términos del desarrollo y los tejidos.
Así que un gen en un tejido podría hacer una proteína,
pero en otro tejido produce una proteína muy diferente.
Es como añadir complejidad.
¿Qué tan complejo puede ser?
Bueno, aquí está el actual poseedor del récord. Así que éste es el gen
de Drosophila, DSCAM, que está implicado en la orientación axonal
en el cerebro. Y Drosophila DSCAM tiene
tres regiones de exones mutuamente excluyentes. Así que hay uno aquí,
uno aquí, uno aquí y otro allí. Esta región tiene 48,
33. Hay 2 allí y hay 12 aquí.
Así que si lo calculamos, hay más de 38.000
diferentes isoformas empalmadas posibles del gen Dscam.
Según lo que sabemos, todas estas isoformas
se pueden hacer. Eso significa que este gen en Drosophila
puede hacer tres veces más proteínas diferentes
de los genes que hay en el genoma de Drosophila.
Así que es muy probable que en eucariotas superiores, como tú y yo,
nuestro proteoma tiene más de cientos de miles o
millones de proteínas diferentes. Así que con eso en mente,
ahora vamos a mirar hacia atrás en nuestro problema de la complejidad.
Pero esta vez, en vez de mirar los genes, veamos
cuántos intrones tiene cada organismo y cómo eso
aumenta con la complejidad. Por ejemplo, en E. coli, que no tiene intrones.
Los procariotes no tienen este tipo de intrones.
S. cerevisiae, o la levadura de gemación, tiene unos pocos intrones.
Sólo tiene unos 250 intrones y cuando subimos la
escala evolutiva, la lombriz tiene cerca de 99.000 intrones,
de nuevo, más que la mosca de la fruta, simplemente porque tiene más genes.
Pero a medida que avanzamos hacia los seres humanos y los ratones, se puede ver
que el número de intrones está subiendo dramáticamente.
Y como el número de proteínas que puedes hacer
crece digamos exponencialmente según el número de intrones,
se puede imaginar que nuestros proteomas pueden ser
mucho más complicados que los de otros organismos.
Ahora queremos hablar sobre el problema de qué hace que
la célula sepa dónde están los intrones. En otras palabras,
¿cómo sabe dónde empalmar? En este sentido,
una célula se enfrenta con el mismo problema que el director de cine,
que ha filmado durante horas y sin embargo
ahora está abrumado con la cantidad de filme y tiene que hacer
una película final. Por eso, tradicionalmente, antes del
era digital, el director de cine revisaba la película
cuadro por cuadro, encontraba exactamente el lugar donde
quería hacer un corte y luego habría una
máquina de empalme que literalmente cortaba y empalmaba la
película de nuevo para hacer la versión final.
En las células, eso es exactamente lo que sucede. Porque
por supuesto, los intrones se componen de nucleótidos individuales
y los nucleótidos son muy similares a los cuadros individuales
en una película. Así que los intrones tienen la siguiente estructura.
El extremo 5', o el comienzo del intrón, es
muchas veces llamado un donante empalmado pero los empalmadores tienden a
llamarlo el sitio de empalme de 5'. En 99% de los genes,
se expresa mediante un GT como los dos primeros nucleótidos del intrón.
Luego, mucho más abajo, en realidad cerca del
otro extremo del intrón, hay una adenosina llamada
el sitio de la ramificación y vamos a hablar de lo que
hace el sitio de la ramificación en la segunda parte de mi conferencia. Luego
al final del intrón está el AG, que son los
dos últimos nucleótidos del intrón en el sitio de empalme 3'
o el "aceptor de empalme". Ahora, les he dicho que algunos
intrones tienen hasta 400.000 nucleótidos de longitud y ciertamente
esta cantidad de información no es suficiente
para significar incluso un pequeño intrón. Así que debe haber
secuencias adicionales. Además de estos nucleótidos
universalmente conservados, hay secuencias de consenso
en todos los intrones. Así que aquí hay
secuencias de consenso para la levadura en ciernes y éstas
se llaman logos, logotipos de motivo, y la altura de la letra
nos dice qué tan conservado es ese sitio. Por ejemplo,
aquí se puede ver el GT en el sitio de empalme 5',
así que además del GT, hay varios otros
nucleótidos que están altamente conservados y unos pocos
que son menos conservados. En el sitio de ramificación en la levadura, hay
una secuencia TACTAAC muy altamente conservada
y luego aguas arriba del sitio de empalme 3', no hay
demasiada conservación hasta que llegues al
sitio de empalme 3'. Así que hay información adicional
en estas secuencias llamadas de consenso. Asombrosamente,
en los seres humanos...si se acuerdan, la levadura sólo tiene alrededor de
250 intrones y por lo general son cortos, todos tienen
menos de unos cuantos cientos de nucleótidos, mientras que
los intrones humanos son mucho, mucho más largos.
Lo sorprendente es que las secuencias de consenso humanas
son menos conservadas. Así que ya pueden ver eso
porque pueden ver que hay muchas más letras
aquí abajo que hay aquí arriba, particularmente para el
sitio de ramificación, mucha menos conservación. Entonces, para
el sitio de empalme 3', hay un poco más de información
porque está esta pista llamada pirimidina aquí,
que es un manojo de C y T de aguas arriba del AG.
Ahora podemos cuantificar la cantidad de información que hay
en estas secuencias mediante la terminología que es
utilizada en la informática: los bits de información.
Entonces, ¿cuánto contenido de información tienen estas cosas?
Chris Burge y sus colaboradores realizaron un estudio sobre
varios intrones muy cortos, los intrones más cortos
en los seres humanos y también los intrones en la levadura. Ellos
derivaron estas secuencias de consenso y estas secuencias de consenso
tienen esta cantidad de información. Así que ya se puede ver
con sólo mirar el número de bits que
los intrones humanos tienen menos información en sus secuencias de consenso
que los intrones de levadura, a pesar de que los intrones humanos,
hay muchos más de ellos y son mucho más largos.
Ahora bien, si sumamos toda esta información, las secuencias de intrones de levadura
claramente tienen más información en sus secuencias de consenso
que los seres humanos. Pero puedo decirles que lo que Chris Burge
y sus colegas predijeron en este documento es que
en los seres humanos, para especificar un intrón únicamente,
incluso de este tamaño corto que estaban mirando,
mucho menos que un millar de nucleótidos, en ese caso se necesitan cerca de
37 bits de información, y sin embargo sólo 23 bits de información
están contenidos en las secuencias de consenso del sitio de empalme.
Entonces, ¿dónde está esa otra información que viene?
Así que del mismo trabajo, aquí hay un gráfico que muestra
las contribuciones relativas de las características de los intrones
al reconocimiento de los intrones en diferentes organismos, y éstos son
los mismos organismos que vimos antes en términos de
la cantidad de genes e intrones y la complejidad.
Lo que se puede ver es que en S. cerevisiae toda la
información proviene del sitio de empalme 5',
el sitio de empalme 3' y las secuencias de consenso del sitio de ramificación.
Pero cuando llegamos al ser humano, sólo la mitad de
la información necesaria para especificar un intrón en los seres humanos
procede de las tres secuencias de consenso.
Parte de la otra información es la longitud. La composición
de los intrones. Son algo diferentes en su composición de base
en comparación con los exones. Pero luego está este gran cuadrante gris
y uno tiene que preguntarse: ¿qué es esta otra información que
requieren los intrones humanos? Encontramos una pista muy temprano,
poco después de que los intrones fueron descubiertos. Este trabajo es
de 1983. Los intrones fueron descubiertos en 1977.
Los laboratorios de Maniatis y Orkin estaban siguiendo
las mutaciones en el gen de la beta-globina. Las mutaciones
en beta-globina causan una enfermedad llamada beta-talasemia.
Es una enfermedad de la sangre muy debilitante, ya que
no haces suficiente hemoglobina. Lo que encontraron fue
que muchas de las mutaciones que causan beta-talasemia
son mutaciones en la secuencia de consenso del sitio de empalme 5'
del gen de la globina. Pero en lugar de matar completamente
el empalme del gen de la beta-globina, lo que estas mutaciones hacen
es activar los crípticos sitios de empalme 5' en la
zona cercana. Eso significa que algo le dijo a la
maquinaria de empalme que debería haber un
sitio de empalme 5' en esta región, y aunque esta secuencia de consenso
se mutó, había otras secuencias
cercanas que podrían servir como un sitio de empalme 5' alternativo y viable.
Entonces, ¿qué es esa otra información?
Para pensar en qué puede ser esa información,
vamos a echar un vistazo a ese modelo del gen de la distrofina
que vimos. Si Uds. recuerdan, aquí está mi larga
cuerda de 99 pies y cuando están mirando la cuerda,
probablemente se fijan en los exones, las
pequeñas piezas de color, y no en la propia cuerda.
En realidad se puede pensar en un gen humano
como islas de exones en el medio de océanos de intrones.
Como en un mapa del Océano Pacífico
si vas a identificar las islas, vas a
fijarte en ellas, no en los extremos de los océanos.
Vas a ver dónde comienzan y terminan las islas,
no dónde se inicia y termina el mar. Así que vamos a pensar
sobre cómo se podría aplicar esto a un gen humano.
Lo que ahora entendemos es que
los intrones y exones se reconocen en los genes humanos
a través de lo que llamamos la definición de exones.
Aunque los intrones son de longitud muy variable --
desde unos cientos de nucleótidos hasta
decenas de miles o cientos de miles de nucleótidos --
los exones tienden a ser mucho más uniformes en su longitud.
El exón promedio, como dijimos, es de 123 nucleótidos,
pero varían en longitud desde aproximadamente 25 nucleótidos. (Hay algunos
un poco más cortos. Hay excepciones a cada regla.) Pero
en general, 25-300 nucleótidos es el tamaño de un éxon interno
de un gen humano. Lo que busca la maquinaria de empalme humano
es un buen partido para el sitio del consenso y ramificación
y para el sitio de empalme 3', seguido de 25-300 nucleótidos
por un buen partido con el sitio de empalme 5'. Eso
entonces define a un exón. Pero incluso con esa información de distancia
entre un sitio de empalme 3' y un sitio de empalme 5' aguas abajo,
eso aún no es información suficiente para identificar
a un exón y tampoco es suficiente para permitir
el empalme alternativo de ese exón. Así que además de
las secuencias de consenso, también hay otras secuencias
llamadas potenciadores exónicos de empalme o silenciadores de empalme.
Así que estos potenciadores o silenciadores pueden estar tanto en el
exón como en los intrones. Si están en intrones
se llaman potenciadores intrónicos de empalme o silenciadores intrónicos de empalme.
Así que serían las secuencias ESE, ISE, ESS e ISS.
Ahora bien, estas secuencias tienden a agruparse alrededor de los exones
y son reconocidas por dos tipos diferentes de proteínas
en general. Estas proteínas se llaman SR y hnRNP.
Ahora, las proteínas SR son proteínas que se unen al ARN y tienen
un dominio C-terminal que es rico en dipéptidos de arginina/serina.
Las proteínas hnRNP son otro conjunto de proteínas que se unen al ARN.
No tienen esa región RS. Pero, en general, las proteínas SR
tienden a reconocer a los potenciadores de empalme. Tienden
a aumentar el empalme y las proteínas hnRNP tienden a
reconocer a los silenciadores de empalme, así que tienden a inhibir el empalme.
Es el equilibrio de las proteínas SR y hnRNP
que están en una célula lo que determina el patrón de empalme
para cualquier ARN particular. Así que Uds. pueden pensar en las
decisiones de empalme como decisiones de comité.
Además de las proteínas SR y hnRNP,
está la maquinaria de empalme central y vamos a hablar
de eso en la segunda parte de mi charla. Sin embargo, el núcleo de la maquinaria de
empalme es lo que es responsable de reconocer a las
secuencias de consenso en los sitios de empalme. Luego
al mismo tiempo, estarían estas
proteínas SR y hnRNP, y entonces es la
conjunción de todos estos factores diferentes que luego
toma la decisión de si un exón se va a
utilizar o no y si se convertirá en ARNm. Así que una cosa
que me gustaría señalar sobre estas secuencias potenciadores
y silenciadoras de empalme es que las mutaciones en las secuencias
pueden dar lugar a enfermedades genéticas humanas. Aproximadamente el 20%
de la enfermedad genética humana está causada por errores en el empalme.
Estos errores pueden ocurrir si se produce una mutación
en una de las secuencias de consenso -- ya lo hemos
visto para los genes de beta-talasemia --
o cuando se produce una mutación en una de las secuencias silenciadores o
potenciadoras. Un error común que se hace
cuando los científicos están buscando las mutaciones que
causan una enfermedad en particular, es que si se encuentra una mutación
en un exón de codificación y la mutación cambia el aminoácido
codificado por ese exón, a menudo se supone que esa mutación
tiene sus efectos perjudiciales mediante el cambio de un aminoácido
en la proteína. Pero de hecho, muchas veces la mutación puede
cambiar el patrón de empalme. Por ejemplo, dejar fuera
un exón entero o cambiar un sitio de empalme sería
mucho más perjudicial. Así que es importante pensar en eso si
estás buscando las mutaciones que causan un trastorno particular
en los seres humanos o algún otro organismo modelo.
También es importante tener en cuenta que no podemos pasar por alto
las mutaciones en los intrones. Además de que las mutaciones en
las secuencias de consenso van a ser perjudiciales
para el empalme, las mutaciones en estos silenciadores y potenciadores
intrónicos de empalme también pueden cambiar el patrón. Así que
en el futuro, vamos a tener que secuenciar
tanto intrones como exones cuando estamos en busca de mutaciones
en la enfermedad humana. Así que aquí están algunos ejemplos de
esos tipos de mutaciones. En la parte superior aquí, tenemos
el gen SMN. Ahora, todos nosotros tenemos dos copias de este gen:
está SMN1 y SMN2. Si tienes una mutación
en SMN1, de tal manera que se interrumpe, es un problema
porque el gen SMN2 es idéntico al gen SMN1
excepto que tiene una mutación T en un potenciador exónico de empalme,
de tal manera que en el gen SMN1 se incluye todo el exón 7,
pero en SMN2 se incluye sólo 20% del exón 7. Así que si
careces del gen SMN1, entonces no produces suficiente
proteína SMN y los niños que no producen una suficiente cantidad de esta proteína
tienen problemas con el desarrollo de sus neuronas motoras
y tienen atrofia muscular espinal. Aquí hay otro
ejemplo. La distrofina es una mutación que provoca un
codón de parada. Así que uno podría asumir que el problema es
que produce una proteína truncada. Pero de hecho
esta mutación de parada, esta mutación sin sentido, está en un silenciador exónico de empalme,
o se convierte en un silenciador exónico de empalme de tal manera que
el exón se queda afuera. Todavía hace esa proteína,
pero carece de ese exón. Luego, éste es un tercer ejemplo.
Los pacientes que sufren de demencia frontotemporal a menudo tienen
una mutación en el gen tau. Esa mutación
vuelve más fuerte a un potenciador exónico de empalme, de tal manera que
hace más de la versión de la proteína
que incluye el exón 10 y menos de la que lo excluye.
Esta relación 50/50 es muy importante para tener
cantidades normales de la proteína tau. Así pues, en este caso,
los pacientes están sobreexpresando esta forma truncada de la proteína
y eso conduce a la demencia frontotemporal.
Finalmente, me gustaría dejarlos con algunos mensajes para llevar a casa.
El primero es que los genes eucariotas contienen intrones.
No todos los genes eucariotas contienen un intrón,
pero sin duda en la gran mayoría de los seres humanos, los genes contienen
intrones. Estos intrones facilitan la evolución de nuevos genes
y al permitir el empalme alternativo, nos permiten
aumentar considerablemente la complejidad de nuestro proteoma. Los
eucariotes superiores utilizan la definición de exón para definir
sitios de empalme porque los exones son como islas en
océanos del intrones. Por último, muchas enfermedades
humanas hereditarias son causadas por mutaciones
que afectan la inclusión de los exones o la elección del sitio de empalme.
Así termina esta parte de la conferencia. Si Uds. están interesados
en aprender algo sobre la maquinaria que
elimina los intrones, vean mi próxima conferencia, que es sobre
la estructura y la dinámica de los espliceosomas. Gracias.