Obtenga software para "alucinar" estructuras de proteínas razonables

Obtenga software para «alucinar» estructuras de proteínas razonables

Cuatro imágenes de cintas en espiral.
Agrandar / Fila superior: la alucinación y la estructura real. Fila inferior: las dos estructuras superpuestas.

Anishchenko y. Alabama.

Químicamente, las proteínas son solo una larga cadena de aminoácidos. Sus sorprendentes propiedades se deben al hecho de que esta cuerda puede plegarse en una forma tridimensional compleja. Entonces, comprender las reglas que gobiernan este plegamiento no solo podría darnos una idea de las proteínas utilizadas por la vida, sino que también podría ayudarnos a diseñar nuevas proteínas con nuevas habilidades químicas.

Recientemente ha habido un progreso notable en la primera mitad de este problema: los investigadores ajustaron las IA para resolver las relaciones evolutivas entre las proteínas y relacionar las características comunes con las estructuras. Por ahora, sin embargo, estos algoritmos no son de ayuda para diseñar nuevas proteínas desde cero. Pero eso podría cambiar, gracias a los métodos descritos en un artículo publicado el miércoles.

En él, un nutrido equipo de investigadores describe lo que denominan «alucinaciones» proteicas. Son los productos de un proceso que se asemeja a un juego de más cálido/más frío con un algoritmo, comenzando con una secuencia aleatoria de aminoácidos, haciendo un cambio y preguntando: «¿Esto suena más o menos como una proteína estructurada? Varios de los resultados han sido probados y, de hecho, se pliegan como se esperaba.

Alucinaciones de IA

La extraña terminología aquí no se puede culpar a los autores del nuevo artículo. En cambio, el término «alucinación» se aplicó al trabajo realizado por el equipo de IA de Google. Este trabajo implicó comenzar con una imagen de píxeles aleatorios y preguntarle a una red neuronal entrenada para reconocer frutas: «¿Cuánto se parece a un plátano?» Después de algunos ajustes aleatorios, se volvió a hacer la pregunta; se mantuvieron todos los cambios que aumentaron las propiedades del banano de la imagen y se repitió el proceso.

El resultado final claramente tiene aspectos de plátano, pero se parece más a un cubista y un impresionista que probaron plátanos antes de ejecutar algunos filtros aleatorios de Photoshop. Aunque el término no se usa en la publicación del blog de Google, otros han llamado a las imágenes «alucinaciones».

El ruido aleatorio (izquierda) se convierte en una alucinación similar a un plátano (derecha) mediante solicitudes repetidas a una IA que reconoce plátanos.

El ruido aleatorio (izquierda) se convierte en una alucinación similar a un plátano (derecha) mediante solicitudes repetidas a una IA que reconoce plátanos.

Los investigadores pensaron que si funciona para las IA que manejan el reconocimiento de imágenes, también podría funcionar con las IA que sugieren estructuras 3D para proteínas.

Publicidad

Sin embargo, aquellos de ustedes que presten mucha atención pueden notar un problema. Los algoritmos específicos de biología no producen una evaluación de si algo se parece a una estructura; en cambio, simplemente asumen que hay una estructura y tratan de sugerir de qué se trata. Por lo tanto, no están inherentemente configurados para hacer el tipo de retroalimentación más caliente o más fría que se necesita para crear una alucinación.

Sin embargo, el equipo de investigación encontró una forma de evitar este problema. Las proteínas no estructuradas tienden a dispersarse en el espacio, con solo un puñado de aminoácidos vecinos interactuando entre sí. Las proteínas altamente estructuradas, por otro lado, tienden a ser compactas y plegarse, por lo que los aminoácidos de diferentes partes de la cadena pueden interactuar entre sí. El algoritmo que usaron para la predicción de estructuras, trRosetta, produce sus predicciones como la ubicación relativa de cada aminoácido en el espacio 3D. Entonces, al usar una medida de su propagación, los autores pudieron proporcionar algún tipo de respuesta a la pregunta «¿qué tan estructurado se ve?»

de casualidad

Para desencadenar sus alucinaciones estructurales, los investigadores generaron numerosas proteínas compuestas por 100 aminoácidos aleatorios y las introdujeron en el software trRosetta. Como era de esperar, todas las proteínas estaban inicialmente desestructuradas. Luego, para cada una de las 100 secuencias, se eligió un aminoácido al azar y se reemplazó con un aminoácido diferente que también se eligió al azar. trRosetta luego realizó un nuevo análisis y se compararon los resultados; se mantuvieron todos los cambios que hicieron las cosas más estructuradas.

Después de unas 20.000 repeticiones de este proceso, la compacidad de la disposición de los aminoácidos en estas alucinaciones era de naturaleza similar a la de las proteínas ordinarias. Pero, sobre todo, las secuencias de aminoácidos no se parecían a las de las proteínas conocidas. Tampoco las propias estructuras. En las proteínas utilizadas por la vida, a menudo hay bucles de aminoácidos mal estructurados que realizan funciones clave. Pero las alucinaciones no fueron seleccionadas por su función; fueron seleccionados por su compacidad. Entonces, este tipo de bucles extendidos no se han encontrado en las alucinaciones.

Hay algunas razones para ser escépticos de que las cadenas reales de aminoácidos formen estas estructuras en el mundo real. trRosetta no es el último y mejor software de predicción de estructuras que acaparó los titulares. Y trRosetta fue entrenada para comprender la estructura en parte mediante la evaluación de las relaciones evolutivas. Estas proteínas son completamente nuevas y no tienen parientes evolutivos. El proceso solo funcionaría si la red neuronal utilizada en trRosetta hubiera inferido los principios de la estructura de las proteínas a partir de estas relaciones evolutivas.

La única forma de saber si funcionó es hacer las proteínas reales y ver cómo se ven. Así, el equipo de investigación reunió genes que codifican 129 proteínas alucinatorias.

Deja un comentario

Tu dirección de correo electrónico no será publicada.