Apple desarrolla una IA ligera para predecir el plegado de proteínas


El trabajo de Google Deepmind con Alfafold fue nada menos que un milagro, pero es costoso en el cálculo. En este espíritu, los investigadores de Apple comenzaron a desarrollar un método alternativo para usar IA para predecir la estructura 3D de las proteínas, y esto parece prometedor. Aquí están los detalles.

Si no estás familiarizado con AlfafoldEs el modelo de inteligencia revolucionario de Google DeepMind el que puede predecir la estructura 3D de una proteína de su secuencia de aminoácidos. Esto ha sido particularmente precioso para ayudar a desarrollar medicamentos más efectivos, así como materiales completamente nuevos.

Hasta hace unos años, era un problema increíblemente difícil. Predcular la estructura atómica de tres dimensiones de una sola proteína podría llevar meses o incluso años.

Pero gracias a Alphafold, y ahora Alfafold2, así como a otros modelos máximos como Rosettafold y ESMFold, este proceso de predicción lleva tan solo unas pocas horas, o incluso unos minutos, dependiendo del equipo.

Cada uno de estos modelos utiliza sus propios métodos y ejecutivos para lograr tal precisión, pero en general, requieren cálculos extremadamente costosos, y sus marcos tienen una estructura muy estricta.

Como dicen los investigadores de Apple:

«Los modelos de plegamiento de proteínas establecidos como Alfafold2 y Rosettafold han alcanzado la precisión revolucionaria al confiar en arquitecturas cuidadosamente diseñadas que integran concepciones específicas al dominio pesado para las secuencias AA, representaciones de pares de parejas y actualizaciones triangulares.

Ingrese el pliegue simple de Apple

En su modelo propuestoEn lugar de confiar en «MSA, emparejas tarjetas de interacción, actualizaciones triangulares o cualquier otro módulo geométrico equivalente», Apple se basa en modelos de correspondencia de flujo llamados de SO, que se introdujeron en 2023 y demostró ser muy popular para los modelos de texto y texto 3D.

En una palabra, la tasa de correspondencia de flujo es una evolución de los modelos de difusión que hemos cubierto en esta publicación. Pero en lugar de simplemente eliminar iterativamente el ruido de una imagen inicial, aprenden una ruta más suave que transforma directamente el ruido aleatorio en una imagen terminada en una vez.

Y debido a que este método salta muchas etapas de Scour, es menos costoso en el cálculo y genera resultados más rápido.

Los investigadores de Apple han entrenado simple con varios tamaños diferentes, incluidos los parámetros de 100 m, 360m, 700m, 1.1b, 1.6b y 3b, y los evaluaron en «dos puntos de referencia de estructura de proteínas ampliamente adoptadas: CAEPO22 y CASP14, que son pruebas rigurosas para la generalización, la robustez y la precisión del nivel atómico en los modelos plegables». ».

Los resultados fueron muy prometedores:

«A pesar de su simplicidad, SimpleLdfort obtiene un rendimiento competitivo en comparación con estas líneas básicas. En ambas marcas, Simpleflock muestra un rendimiento coherente que ESMFLOW, que también es un modelo de correspondencia de flujo construido con modelos ESM. Rosettafold2 / Alfafold2 en la mayoría de las medidas sin aplicar la atención costosa y heurística y MSA.» »»

Y

«Para la agotividad, informamos los resultados de SimpleLdfold utilizando diferentes tamaños de modelo. El modelo más pequeño de 100m simple muestra un rendimiento competitivo dado su ventaja de la eficiencia en la capacitación e inferencia. En particular, Simplefld alcanza más del 90% del rendimiento de ESMFold en CAMEO22, lo que demuestra la efectividad de construir un modelo de plegado utilizando bloques arquitectónicos para el uso general».

También han visto mejoras en el rendimiento alineadas en la escala, lo que significa que los modelos más importantes con más datos de entrenamiento de entrenamiento ofrecen un mejor rendimiento de plegado, especialmente en los puntos de referencia más difíciles.

Finalmente, señalan que simplemente es solo un primer paso, y dicen que «esperan) sirve como una iniciativa para que la comunidad construya modelos que generan proteínas efectivas y potentes».

Puedes leer el Estudio completo sobre arxiv.

Ofertas de accesorios en Amazon

FTC: utilizamos enlaces de afiliación de ingresos automáticos. Más.



Fuente