El éxito alcanzado con esta herramienta, anuncia la creación de un nuevo campo de la biología sintética, con el que se podrían generar soluciones para combatir enfermedades, y proteger el medio ambiente
Todos los días, en innumerables actividades, y sin que la mayoría de las veces nos percatemos de ello, o estemos conscientes, la Inteligencia Artificial (IA), esta sorprendente herramienta tecnológica es capaz de analizar, aprender, comparar, predecir y tomar decisiones aplicadas a un objetivo específico, todo ello sin que intervengan neuronas humanas.
Es todavía tema de grandes miedos, y profundas discusiones por el posible impacto futuro que podría tener en la vida humana, tema sobre el que se han escrito cientos de miles de páginas y realizado un sinfín de películas, unas mejores que otras, pero prácticamente todas ellas anunciando un final desastroso para la especie humana, en el que las máquinas toman el control sobre nosotros.
Más allá de estas aplicaciones, los campos en los que la IA genera mayor desazón, son aquellos en los que ésta supera las capacidades humanas, como el arte y los juegos de mesa y estrategia, entre los que destaca el ajedrez, juego en el que esta herramienta tecnológica ha demostrado una impresionante capacidad predictiva, derrotando a los campeones humanos que han caído abatidos sin misericordia.
Pero lo que es nuevo, es el uso de la potencia de la IA para la creación de 20 secuencias de aminoácidos que componen las proteínas, en un lapso muy reducido, labor que de manera natural se ha dado a través de millones de años de evolución.
“Las proteínas son los caballos de batalla esenciales de la biología que llevan a cabo funciones espectacularmente variadas, desde combatir virus en el cuerpo humano hasta degradar plásticos. Fundamentalmente, las proteínas son cadenas de moléculas de aminoácidos que han evolucionado naturalmente durante miles de millones de años a través de mutaciones. En lugar de confiar en el largo arco de la evolución natural, ¿qué pasaría si pudiéramos tomar el control y diseñar proteínas nosotros mismos desde cero?”. Salesforce. Learning from evolution: Using AI language models to design functional artificial proteins.
El modelo de lenguaje de IA, bautizado como ProGen, fue desarrollado por un equipo de investigadores de la Universidad de California-San Francisco, la Universidad de California-Berkeley y Salesforce Research, una rama científica de la empresa de software con sede en SF, quienes publicaron los resultados obtenidos en la revista Nature Biotechnology a mediados del año pasado, bajo el título: “Large language models generase functional prtotein sequences across diverses families”.
Al respecto, Ali Madani, Ben Krause y Nikhil Naik, todos miembros de la empresa Salesforce, declararon: “Mostramos que nuestro modelo de lenguaje, llamado ProGen, puede aprender el lenguaje de las proteínas para generar secuencias de proteínas artificiales en varias familias. Validamos nuestro modelo mediante la síntesis de proteínas de lisozima antibacterianas artificiales en el laboratorio y comparamos su fuerza antibacteriana con las proteínas naturales. Aunque muchas de nuestras proteínas artificiales son bastante diferentes de las proteínas naturales, son igual de efectivas en el desempeño antibacteriano. Nuestro trabajo demuestra que podemos usar la IA como una herramienta controlable para diseñar proteínas para nuestros propósitos previstos en biología”.
Lo sorprendente es que los investigadores usaron un algoritmo de IA de los llamados “modelos de lenguaje neuronal”, para diseñar estas proteínas, capaces escribir un texto artificial imitando el lenguaje humano, indistinguible de uno creado por nosotros, y la razón para usarlos, es que las proteínas se pueden representar como un lenguaje formado por aminoácidos, las 20 moléculas que forman cada proteína.
“De la misma manera que las palabras se unen una por una para formar oraciones de texto, los aminoácidos se unen uno por uno para formar proteínas. Sobre la base de esta idea, aplicamos el modelado del lenguaje neuronal a las proteínas para generar secuencias de proteínas realistas pero novedosas”. Ali Madani, Ben Krause y Nikhil Naik. Salesforce.
Para ello, entrenaron un modelo de lenguaje “condicional” que se puede dirigir con las entradas del usuario para generar lenguaje con ciertas propiedades indicadas previamente por el usuario llamadas “etiquetas de control”, las que en este caso indicaban propiedades biológicas como la familia de proteínas, el proceso biológico o la función molecular, consiguiendo que la IA diseñara (en lenguaje) un grupo de proteínas artificiales antibacterianas, cuya capacidad fue comparada contra proteínas desarrolladas de manera natural en laboratorio. A través de un protocolo conocido como “ensayo de actividad”, se analizó la función antibacteriana de las proteínas naturales y artificiales (lisozimas), concluyendo que el 73% de las proteínas antibacterianas artificiales eran funcionales, versus el 59% de funcionalidad de las proteínas naturales. Algo realmente sorprendente.
“En un futuro cercano, la generación condicional de secuencias de proteínas podría usarse para diseñar proteínas altamente adaptadas con las propiedades deseadas, como la capacidad de unirse a otra molécula o la capacidad de operar a altas temperaturas. Alcanzar estos objetivos, con una cuidadosa consideración de las implicaciones éticas, nos permitirá desarrollar rápidamente tratamientos para enfermedades o enzimas para aplicaciones industriales y ambientales. En términos más generales, nuestro trabajo abre muchas puertas nuevas para utilizar tecnología de modelado de lenguaje de IA de última generación para acelerar la ingeniería de proteínas”. Ali Madani, Ben Krause y Nikhil Naik. Salesforce.
El uso de la IA para el diseño de aminoácidos específicos para combatir enfermedades, o degradar plásticos, por ejemplo, es el inicio de una senda que puede, junto con otros descubrimientos y aplicaciones, cambiar la hoja de ruta de la humanidad en múltiples ámbitos, entre los que destacan la salud y el medio ambiente.
Por: Manuel Garrod, miembro del Comité Editorial de códigoF.
Fuentes:
Nature Biotechnology. (12 de julio 2022).
Large language models generase functional prtotein sequences across diverses families.
salesforce. (21 de Julio del 2019).
Learning from evolution: Using AI language models to design functional artificial proteins.