biologia molecular, Cochabamba, Bolivia, abril 2006
La transcripción en los mamíferos
Jean-Pierre HERVEG* y Maritza BARCIA-MACAY**
*Université de Louvain, Unité GECE, Christian de DUVE Intitute of cellular Pathology (ICP), Brussels, Belgium.

plan
a continuación



A. La transcripción en los mamíferos
1. La máquina de base de la transcripción:
2. Enviado de la ARN polimerasa II al sitio de iniciación
3. La transcripción de ARNm
4. Empalme alternativo
5. Pseudogens
6. Secuencias repetitivas
7. Expresión de genes procariotas en las células de mamíferos
D. Conclusiones:


a continuación


   


A. mamíferos:


Todos los gens tienen promotor y término. Con mucha frecuencia en los promotores se encuentra una secuencia llamada caja TATA que está en la región -20. No hay zonas en -35. Muchos gens tienen secuencias que pueden estar lejos de ellas para engrADNecer, promover (enhancers) o desactivar (silencers) la transcripción. Esto se logra mediante una proteína (elementos trans) que se une a una secuencia (elemento cis).

intrones
El mensaje está interrumpido por intrones que en el RNA se pierden. Las terminaciones se pierden y aunque no se sabe bien para qué sirven parece que sirven para un procesamiento del RNA. El RNA se mueve hasta que una enzima lo corta. Es muy común que muchos RNA mensajeros terminen en una cola común llamada poliA a_adida por una endonucleasa posterior (no codificada). La cola sirve para separarlos del resto.

tres tipos de gens codifican:

RNA ribosómico.
ARN mensajeros, cola poliA, intrones, exones ... todo explicable.
tRNA y para uno ribosómico pequeño (rRNA 55)
.


a continuación


1. La máquina de base de la transcripción:

tres ARN polimerasas
RNA polimerasa 1: transcripción de gens ARNr 5,8 S, 18 s, y 28 s. actinomycina D
RNA polimerasa 2: ARNm, ARNt y pequeño ARN nuclear. alfa-amanitina
RNA polimerasa 3: ARNr 5 s y pequeño ARN nuclear.
Las ARN polimerasas están constituidas de al menos 10 sub-unidades, ciertas de entre ellas son comunes a las 3 enzimas mencionadas. Las más grADNes sub-unidades de cada polimerasa son homólogas entre ellas y entre sus sub-unidades a, b y b' al ARN polimerasa de la E. coli.

GTFs:
Para transcribir un gen, la ARN polimerasa necesita factores proteícos llamados TIFs (transcription initiation factors) ó GTFs (genral transcription factors) que la ayudan a ubicarse en la posición adecuada.



Los GTFs se unen a la ADN y forman un complejo que atrae la ARN pol. Así forman un complejo de pre-iniciación ó maquinaria basal de la transcripción. Los GTFs asociados a la 3 ARN polimerasas contienen compuestos comunes, como la TATA-binding protein (TBP), una proteina de ligado que se une a secuencias específicas de ADN.
La maquinaria basal de la transcripción no permite más que una actividad transcripcional mínima. En la ausencia de otras proteinas, éstos complejos se asemblan lentamente y son inestables. La eficiencia de la transcripción se mejora por la interacción del complejo de iniciación junto con las proteínas ligadas a los elementos de ADN situados sea alrededor del promotor o en sitios más lejanos.

a continuación


2. Enviado de la ARN polimerasa II al sitio de iniciación

Los promotores de base: Inr y TATA box (caja TATA):
El promotor de base puede estar constituido de un iniciador (Inr), elemento localizado en el sitio de la iniciación de la transcripción. El consensus de su secuencia es YYCARR. El puede también estar constituído de una caja TATA (conocida también como caja de Goldberg-Hogness) situada entre 25 a 30 nucleótidos del sitio de la iniciación de la transcripción. El consensus de su secuencia es TATAWAW. Los elementos Inr y TATA pueden estar ambos presentes.

Estos elementos sirven de sitio de reconocimiento por los GTFs. Los GTFs permiten poner en un lugar preciso el complejo de iniciación. Los gens que no poseén ni caja TATA, ni iniciador dependen de elementos situados a su alrededor para liarse al complejo de iniciación. Otros gens presentan numerosos sitios de iniciación, como en el caso que la polimerasa no pudiera fácilmente posicionarse.

La caja TATA, cuADNo ella está presente, es primero reconocida por el factor TFIID (TF, no se presenta en la figura). IIF está compuesto del factor TBP (TATA binding protein) y de una serie de factores asociados llamados TAFs (TBP-associated factors).

Los TAFs son capáces de reconocer promotores desprovistos de caja TATA


a continuación


Otros factores multiméricos se unen enseguida de manera secuencial al promotor. TFIIH aporta la ARN polimerasa al complejo. TFIIH es esencial en el complejo de pre-iniciación ya que el posée actividad helicasa que controla la denaturación del promotor.

Los elementos promotores (enhancers) y inhibidores (silencers):
Estos elementos reguladores, distantes del promotor de base, están situados a lo largo del sitio de iniciación de la transcripción, a veces cercanos, otras veces lejanos del sitio de iniciación. A veces se encuentran incluso en el mismo gen que vá a ser transcripto. Estos elementos sin embargo no son indispensables a la transcripción, sino que se fijan a las proteinas que regulan la transcripción., acelerADNo o retardADNo el proceso. La secuencia nucleotídica de éstos elementos determina la proteina final que va ser fijada. Estas proteinas reguladoras reaccionan con las regiones cercanas del promotor ó con los sitios lejanos llamados « enhancers » (si facilitan.la transcripción) ó « silencers » (si la retardan). En el caso de sitios distante, las proteinas regulatrices reaccionan con el complejo de iniciación formADNo un lazo con el ADN que separa el promotor de la secuencia en la cual la proteina regulatríz se fija.

Los enhancers y silencers reaccionan genralmente independientemente de su posición ó de su orientación al sitio de iniciación de la transcripción.

Ciertos factores transcripcionales son activos en todas las células., y contribuyen a la actividad transcrpcional constitutiva de gens. Otros factores responden a los estímulos externos (hormonas, iones metálicos,...) para aumentar ó réducir la velocidad de iniciación de la transcripción, y se dice que su actividad es reguladora.


a continuación

3. La transcripción de ARNm


no cebadores
La molécula de ARN se transcribe por la ARN polimerasa a partir de una sola de las dos hebras de la molécula de ADN. Contrariamente a las ADN polimerasas, las ARN polimerasas no tienen necesidad de un cebador para iniciar ésta transcripción y son incapaces de identificar y de eliminar un nucleótido mal aparejado dentro de una cadena en síntesis.


a continuación
El CAP

El primer nucleótido transcrito es a menudo una purina la cual es modificada immediatamente por la enzima ARNm guaniltransferasa para formar una especie de cabeza, tapón ó gorro llamado m7Gppp ó cap. Es por ésto, que el sitio de iniciación de la transcripción de gens transcritos por la ARN polimerasa se llama también sitio « cap ». La cabeza es un residuo 7-métilguanosina unido a la ARNm por un enlace 5'-5' trifosfato.
Ocasionalmente, las pentosas de los nucleótidos adjacentes son igualmente metilados. Si se pudiera aislar un ADNc completo, éste comenzaría por ése nucleótido A. Ocurre raramente, que los ADNc obtenidos son más cortos, entre 10 a 15 nucleótidos. Para conocer el punto de partida exacto de la transcripción es necesario genralmente tener que recurrir a otras técnicas. La cabeza juega sin duda un rol en la protección del ARNm vis-à-vis de la degradación por las nucleasas y sirve igualmente de sitio de reconocimiento para la maquinaria de síntesis proteíca.
Los gens implicados en las reacciones de stress y en la mitosis están desprovistos de CAP. Los ribosomas se acercan al mensajero utilizADNo sitios internos llamados IRES.


a continuación

Señales de poliadenilación

En la extremidad 3' de la mayoría de los gens eucariotas, se encuentran una ó más secuencias AATAAA (aauaaa en ARN). AAUAAA es la señal que se necesita para la adición de una cola poly-A de alrededor de 15 nucleótidos en promedio. Si hubiera mayor número de secuencias, significaría que el fin de la secuencia varía de un órgano a otro. AAUAAA no es una señal de terminación de la transcripción, sino que la transcripción se produce entre ésas sequencias.

La secuencia AAUAAA utilizada en un tejido dado servirá de señal para que una endonúcleasa corte la cadena de ARN nascente en un sitio específico de alrededor de 10 à 15 bases en promedio. Una segunda enzima, la polimerasa poly-A, añade entonces une cola poly-A de longitud de 20 a 200 residuos A. El significado de la cola polyA es un poco desconocido, pero se piensa que ella aumenta la estabilidad de los ARNm y permite la iniciación de la traducción.



a continuación

Señales de empalme (splicing)

Las secuencias no codantes son injertadas entre las secuencias codantes de gens. Estas secuencias se conocen como intrones. Las secuencias codantes se llaman exones.
La transcripción forma primero un transcripto primario ó pré-ARN para cada gen, aún para aquellos que no son exprimidos de manera proteíca. Estos pre- ARN son la más simple sucesión de intrones y exones de un gen. Esta molécula se la encuentra empalmada (splicée) en el núcleo de manera a eliminar todos los intrones. Los intrones existen en casi todos los gens de los mamíferos y de los vertebrados; así como en las plantas. Otros, como la mayoría de los gens de la levadura Saccharomyces cerevisiae no contienen intrones.

Las secciones exones-intrones de numerosos gens han sido ya secuenciadas : una secuencia consensus se ha propuesto. Un intrón comienza siempre por un GT y termina por un AG.


a continuación

El empalmaje se lleva a cabo por dos reacciones de trans-esterificación. En la primer reacción, el 2' OH de una adenosina situada cerca de la extremidad 3' de un intrón ataca el sitio de empalme situado en 5'. Esto libera lel exón situado en la fila y forma un intermediario en forma de "lazo" ("lariat").
Enseguida, en la segunda reacción, el 3' OH del exón en línea ataca el sitio de empalme situado en posición 3' ó al sitio aceptor del empalme. Esto permite unir los dos exones, el uno al otro y de liberar el intrón en forma de lazo. En ésta molécula en forma de lazo, la extremidad 5' del intrón se une a la adenosina por un enlace fosfodiéster 2'-5' inhabitual

a continuación

a continuación


Las secuencias consensus del empalme siguen un mecanismo que primero reune las dos extremidades del intrón antes de excisarlo.

Este mecanismo de empalme involve a cinco moléculas peqeñas de ARN nuclear ó RNA nuclear pequeño (U1, U2, U4, U5 et U6) y una docena de proteínas.

U1 juega un rol esencial en el reconocimiento del sitio donor de empalmaje. U2, U5 y U6 son los únicos snRNAs directamente envueltos en las reacciones de empalme propiamente dicha. De ésos 3 snRNAs, U6 es el único que está más implicado en la catálisis de la reacción de empalmado. U5 permite mantener los exones en línea una vez que éste ha sido soltado del intrón después de la separación del sitio donde se produce el empalme. Esto permite también de conservar los exones alineados de manera de unirlos unos con otros a lo largo de la segunda etapa de la excisión.


a continuación


4. Empalme alternativo

 


Sucede con frecuencia que dos tipos de células puedan sintetizar la misma proteína en cantidades diferentes ó que la síntesis en lugares diferentes se produzca en el mismo gen. En el caso de la síntesis de la a-amilasa de rata, ésta puede suceder ya sea en la glándula salivar ó en el hígado. En ambos casos, dos moléculas de ARNm diferentes son traducidas a partir del mismo gen. Las extremidades 5' de ésos ARNm, sinembargo difieren. Estas diferencias suceden a una distancia de 2,8 kb. Estos dos ARNm contienen la misma secuencia codante. La secuencia comienza 50 bases adelante del exón 2 y continúa hacia los exones suguientes. En las células de las glándulas salivares, la maduración de la transcripción primaria conduce al entrecruze del exón S con el exón 2 al tiempo que el exón L es liberado junto con los intrones 1 y 2. En las células del hígado, el exón L se une al exón 2. Así, los exones S y L se convierten alternativamente en las secuencias cabeza del ARNm de la amilasa. Los exones S y L no son traducidos, sino que son influenciados por promotores diferentes resultADNo en que la velocidad de la transcripción se produzca 100 veces más rápidamente en las glándulas salivares que en el hígado.


Por tanto, las células de la glándula salivar de la rata producen 100 veces más de enzima a pesar de utilizar para la transcripción la misma secuencia codante. El ejemplo presentado a continuación te permitirá practicar éstos conocimientos. En ése caso se trata de dos gens, uno exprimido en las células musculares y otro en el hígado.


a continuación


5. Pseudogens:

Los pseudogens son gens no funcionales, pero que parecen tener función. El gen ya1 se localiza en el locus del gen de la _-globina cuyo análisis de su secuencia ha mostrado que se localiza cerca de 3 gens funcionales de __ -globina. Sinembargo, el pseudogen contiene numerosas mutaciones y no codifica más de una globina funcional. Por ejemplo, el codón de iniciación ATG ha sido cambiado en GTG y las secuencias consensus de las extremidadés 5' de los 2 intrones contienen mutaciones que no dejan que suceda un empalme correcto. Existen numerosas mutaciones punctuales y varias supresiones en el interior de la secuencia codificante. Se piensa que éstos gens son el resultado de duplicaciones de un gen de la __ -globina. Inicialmente, tal vez éstos gens fueron funcionales, pero quizás una mutación los convirtió en inactivos en algún momento a lo largo de nuestra evolución. Como el gen se encuentra duplicado, una mutación en una de las copias no afecta el buen funcionamientot del organismo. Otras mutaciones han podido también talvéz también producirse y accumularse hasta formar al pseudogen actual.


Existe en los cromosomas eucariotas otro tipo de gens no funcionales llamados pseudogens maduros. Estos parecen ser copias perfectas de ARNm , -à-d. pero todos sus intrones parecen haber sido eliminados al nucleótido cercano y carecen de promotor. A la extremidad 3', presentan una serie de adeninas parecidas a la cola-A del ARNm.

Se cree que luego de una infección por un retrovirus, ésos gens sin intrones fueron producidos por una transcripción inversa (reverse transcription) de ARNm citoplásmico. Lo cual les confirió ADNc y fueron reinsertados al ázar a lo largo del genoma.


a continuación


6. Secuencias repetitivas

El genoma de casi todos los eucariotas contienen familias de cortes ó secuencias repetidas. Las secuencias se denominan SINE, describiendo elementos de corta interdispersión (Short Interspersed Elements) de una talla entre130 a 300 bp (pares de bases que) se encuentran repartidos dentro del genoma en millares de copias. Dos SINEs provenientes de dos individuos diferentes contienen en genral 80 % de identidad, mientras que dos SINEs provenientes de dos espécies diferentes sólo presentan un 50 % de homología.


La familia más importante de SINEs entre los seres humanos contiene en común la secuencia Alu. Estas secuencias quizás pueden servir para reparar el ADN humano introducido en una línea célular extraña, como de rodadores por ejemplo. La función de las secuencias Alu y la de otras familias de elémentos dispersados no es realmente bién conocida.

a continuación

7. Expresión de genes procariotas en las células de mamíferos:



Un gen procariota puede exprimirse en una célula de mamífero si se la introduce en la línea de un promotor de mamíferos y en una señal de poliadenilación.

La mayoría de gens se exprimen de manera eficáz en presencia de intrones, Así mismo, la mayoría de los vectores poseén un sitio aceptor y un sitio donador para que el empalmaje ó injerto pueda producirse.

Se puede también aumentar la eficiencia del nivel de expresión de la traducción de los gens clonados si se añade un enhancer en el vector. El virus SV40 produce una de las señales enhancer ó propagadoras más utilizadas. En los mamíferos, el ARN está compuesto de nucleótidos que separan el sitio del comienzo de la transcripción del sitio de traducción de la misma, y el número de nucleótidos no es crítico. Lo crítico es el orden del codón de inicialización del gen clonado. En la trancripción, éste debe ser el AUG. Al no respetar ésta ley, la traducción puede significativamente reducirse junto con la eficiencia de la transcripción .

Si una unidad de transcripción codifica dos polipéptidos, la eficiencia de la traducción se reduce en genral por al menos en un factor de100 en la lectura, aún si se encuentra un codón de terminación en fase, entre las 2 ranuras de lectura abierta. Los vectores recombinantes obtenidos se amplifican en bacterias antes de ser introducidos en las células de mamíferos en cultivo.


a continuación


D. Conclusiones:

Iniciación de la transcripción por la ARN polymérase II. El primer nucleótido de la transcripción primaria se convierte en el primer nucléotido del ARNm.
Adición del gorro a la extremidad 5' de cada transcripto primario hasta alargarlo unos 20 a 30 nucleótidos.
Transcripción ya sea a partir de una señal de poliadenilación, ó producida por la separación de una extremidad 3'-OH mediante una endonucleasa, con adición de la cola poly-A rápidamente añadida.
Injerto o empalme de transcritos primarios en el núcleo hasta la obtención de un ARNm maduro. Este ARNm maduro es entonces transportado hacia el citoplasma donde es traducido.
Resultados recientes iindican aue la ARN polimerasa II podría asociarse al emparejamiento de la poliadenilación y al splicéosome mientras ella se desplaza a lo largo del ADN. De ésta manera, el gen de la distrofina de una longitud de 2.300 kb sería empalmado a medida que es traducido.



plan

biologia molecular, Cochabamba, Bolivia, abril 2006
La transcripción en los mamíferos
Jean-Pierre HERVEG* y Maritza BARCIA-MACAY**
*Université de Louvain, Unité GECE, Christian de DUVE Intitute of cellular Pathology (ICP), Brussels, Belgium.