Dos nuevos artículos analizan en detalle el universo de proteínas revelado por los 200 millones de modelos de AlphaFold 2

Dos artículos analizan el universo de proteínas de AlphaFold 2

Y tuvieron que crear nuevas herramientas para manejar tal volumen grande de modelos estructurales de proteínas

Uno de los recursos presentados en los artículos discutidos, https://uniprot3d.org/, representa proteínas dispersas como en una visión moderna del universo donde los cúmulos más brillantes contienen más miembros. Al hacer zoom, el usuario puede inspeccionar proteínas relacionadas, hasta que hacer clic en un nodo específico muestra información (aquí solo se muestra un modelo estructural) sobre una familia de proteínas en el contexto de Uniprot. Imagen compuesta por el autor mientras navegaba por el sitio web.

El reciente lanzamiento de más de 200 millones de estructuras de proteínas predichas por AlphaFold 2 de DeepMind, en colaboración con el Instituto Europeo de Bioinformática, ha dado inicio a una nueva era en la investigación de proteínas. Aquí presento un resumen de los hallazgos de dos artículos innovadores publicados en Nature esta semana, que exploran las profundidades de este universo de proteínas. Estos artículos utilizan algoritmos de agrupamiento innovadores, comparaciones estructurales y otras adaptaciones de herramientas existentes para trabajar con grandes volúmenes de datos, para arrojar luz sobre la diversidad estructural, las relaciones evolutivas y el potencial funcional de las proteínas a una escala sin precedentes.

Las proteínas son los caballos de batalla de la biología, gobiernan una miríada de procesos celulares, desde la generación de energía hasta la división celular. Si bien la secuenciación de proteínas ha crecido a lo largo de los años gracias a los avances en la genómica, la determinación de sus estructuras tridimensionales ha quedado rezagada debido a la falta de métodos experimentales escalables. Sin embargo, con la llegada de AlphaFold 2, un revolucionario sistema de IA desarrollado por DeepMind, el panorama de la predicción de estructuras de proteínas ha sido transformado. La Base de Datos de Estructuras de Proteínas de AlphaFold (AFDB) ahora alberga asombrosamente 200 millones de estructuras de proteínas predichas, marcando un hito en la biología computacional.

Bases de datos basadas en AlphaFold e interfaces de AlphaFold en línea completamente desarrolladas y fáciles de usar, listas para…

No solo biología computacional sino también biología experimental. Reflexiones sobre el futuro de las áreas de la ciencia de datos en biología.

towardsdatascience.com

Ahora, esta misma semana, dos grupos de autores escriben en Nature para informar sobre cómo utilizar los modelos de proteínas de AlphaFold 2 para descubrir nuevos conocimientos sobre el universo de las proteínas. Estos estudios aprovechan versiones innovadoras de herramientas existentes adaptadas al enorme volumen de datos en la AFDB; por ejemplo, versiones modernas de algoritmos de agrupamiento y métodos de comparación estructural. Con estas herramientas adaptadas, los trabajos exploran la vasta cantidad de estructuras de proteínas, sus orígenes evolutivos y sus implicaciones funcionales.