Vea También
ESM3 es un modelo de lenguaje generativo multimodal entrenado con una vasta cantidad de datos biológicos: 771 mil millones de tokens derivados de 3.150 millones de secuencias de proteínas, 236 millones de estructuras proteicas y 539 millones de anotaciones funcionales. Esta extensa base de datos le proporciona al modelo un conocimiento equivalente a 500 millones de años de evolución, permitiéndole diseñar proteínas con secuencias genéticas únicas.
La capacidad de ESM3 para generar proteínas inéditas abre nuevas posibilidades en diversos campos, incluyendo la medicina y la investigación ambiental. La creación de esmGFP, una proteína que brilla bajo luz ultravioleta, ejemplifica el potencial de la IA para explorar rutas evolutivas que la naturaleza no ha recorrido, ofreciendo herramientas innovadoras para el diseño de proteínas con aplicaciones específicas.
Edición multimodal de proteínas con ESM3. Crédito: Science (2025). DOI: 10.1126/science.ads0018 |
Este desarrollo también proporciona una perspectiva práctica sobre la teoría de la contingencia en la evolución, propuesta por el biólogo Stephen Jay Gould. Según esta teoría, la evolución podría haber seguido caminos muy diferentes bajo circunstancias distintas. La capacidad de ESM3 para simular trayectorias evolutivas alternativas y producir proteínas que no existen en la naturaleza respalda esta noción, sugiriendo que la evolución no es un proceso predeterminado, sino que está influenciado por eventos históricos y contextuales.
Fuentes, créditos y referencias: