Un nuevo programa informático puede leer cualquier secuencia del genoma y descifrar su código genético

Vea También

 

Un nuevo programa informático puede leer cualquier secuencia del genoma y descifrar su código genético
Foto de ANIRUDH en Unsplash

Yekaterina "Kate" Shulgina era una estudiante de primer año de la Facultad de Artes y Ciencias, que buscaba un proyecto corto de biología computacional para poder tachar el requisito de su programa de biología de sistemas. Se preguntaba cómo el código genético, que antes se consideraba universal, podía evolucionar y cambiar.

Eso fue en 2016 y hoy Shulgina ha salido del otro extremo de ese proyecto a corto plazo con una forma de descifrar este misterio genético. Lo describe en un nuevo artículo en la revista eLife con el biólogo de Harvard Sean Eddy.

El informe detalla un nuevo programa informático que puede leer la secuencia del genoma de cualquier organismo y luego determinar su código genético. El programa, llamado Codetta, tiene el potencial de ayudar a los científicos a ampliar su comprensión de cómo evoluciona el código genético e interpretar correctamente el código genético de los organismos recién secuenciados.

"Esto, en sí mismo, es una cuestión de biología muy fundamental", dijo Shulgina, que realiza su investigación de posgrado en el laboratorio de Eddy.

El código genético es el conjunto de reglas que indica a las células cómo interpretar las combinaciones de tres letras de los nucleótidos para convertirlas en proteínas, a menudo denominadas los bloques de construcción de la vida. Casi todos los organismos, desde E. coli hasta los seres humanos, utilizan el mismo código genético. Por eso se creía que el código estaba grabado en piedra. Pero los científicos han descubierto que existen un puñado de organismos atípicos -que utilizan códigos genéticos alternativos- en los que el conjunto de instrucciones es diferente.

Aquí es donde Codetta puede brillar. El programa puede ayudar a identificar más organismos que utilizan estos códigos genéticos alternativos, ayudando a arrojar nueva luz sobre cómo los códigos genéticos pueden incluso cambiar en primer lugar.

"Entender cómo ocurrió esto nos ayudaría a reconciliar por qué originalmente pensamos que esto era imposible... y cómo funcionan realmente estos procesos fundamentales", dijo Shulgina.

Codetta ya ha analizado las secuencias del genoma de más de 250.000 bacterias y otros organismos unicelulares llamados arqueas en busca de códigos genéticos alternativos, y ha identificado cinco que nunca se habían visto. En los cinco casos, el código del aminoácido arginina fue reasignado a un aminoácido diferente. Se cree que es la primera vez que los científicos observan este cambio en las bacterias y podría indicar las fuerzas evolutivas que intervienen en la alteración del código genético.

Los investigadores afirman que el estudio constituye la mayor exploración de códigos genéticos alternativos. Codetta analizó básicamente todos los genomas disponibles de bacterias y arqueas. El nombre del programa es un cruce entre los codones, la secuencia de tres nucleótidos que forman piezas del código genético, y la Piedra Rosetta, una losa de roca con inscripciones en tres idiomas.

El trabajo marca un momento culminante para Shulgina, que pasó los últimos cinco años desarrollando la teoría estadística en la que se basa Codetta, escribiendo el programa, probándolo y analizando después los genomas. Funciona leyendo el genoma de un organismo y luego recurriendo a una base de datos de proteínas conocidas para obtener un código genético probable. Se diferencia de otros métodos similares por la escala a la que puede analizar los genomas.

Shulgina se unió al laboratorio de Eddy, especializado en la comparación de genomas, en 2016 después de acudir a él para pedirle consejo sobre el algoritmo que estaba diseñando para interpretar los códigos genéticos.

Hasta ahora, nadie había hecho un estudio tan amplio para los códigos genéticos alternativos.

"Fue genial ver nuevos códigos, porque por lo que sabíamos, Kate haría todo este trabajo y no resultaría haber ninguno nuevo que encontrar", dijo Eddy, que también es investigador médico Howard Hughes. También señaló el potencial del sistema para garantizar la exactitud de las numerosas bases de datos que albergan secuencias de proteínas.

"Muchas secuencias de proteínas de las bases de datos actuales son sólo traducciones conceptuales de secuencias de ADN genómico", manifestó Eddy. "La gente extrae estas secuencias de proteínas para todo tipo de cosas útiles, como nuevas enzimas o nuevas herramientas de edición de genes y otras cosas. Uno quisiera que esas secuencias de proteínas fueran precisas, pero si el organismo utiliza un código no estándar, se traducirán erróneamente".

Los investigadores afirman que el siguiente paso del trabajo es emplear Codetta para buscar códigos alternativos en virus, eucariotas y genomas organolépticos como las mitocondrias y los cloroplastos.

"Todavía hay mucha diversidad de vida en la que aún no hemos hecho este cribado sistemático", dijo Shulgina.

Fuentes, créditos y referencias:

“A computational screen for alternative genetic codes in over 250,000 genomes” by Yekaterina Shulgina and Sean R Eddy, 9 November 2021, eLife.
DOI: 10.7554/eLife.71402

Fuente:  Universidad de Harvard

Artículo Anterior Artículo Siguiente

Anuncio publicitario

Reciba actualizaciones por Telegram

¡Únete a nuestro canal de WhatsApp para recibir actualizaciones!