Poniendo el poder de AlphaFold en las manos del mundo.

'Empowering the world with the power of AlphaFold.'

En julio de 2022, lanzamos las predicciones de la estructura de proteínas AlphaFold para casi todas las proteínas catalogadas conocidas por la ciencia. Lee el último blog aquí .

Hoy, estoy increíblemente orgulloso y emocionado de anunciar que DeepMind está haciendo una contribución significativa a la comprensión de la biología de la humanidad.

Cuando anunciamos AlphaFold 2 en diciembre pasado, fue aclamado como una solución al problema de plegamiento de proteínas de 50 años. La semana pasada, publicamos el artículo científico y el código fuente que explica cómo creamos este sistema altamente innovador, y hoy compartimos predicciones de alta calidad para la forma de cada proteína en el cuerpo humano, así como para las proteínas de 20 organismos adicionales en los que los científicos confían para su investigación.

A medida que los investigadores buscan curas para enfermedades y buscan soluciones a otros grandes problemas que enfrenta la humanidad, como la resistencia a los antibióticos, la contaminación por microplásticos y el cambio climático, se beneficiarán de nuevas ideas sobre la estructura de las proteínas. Las proteínas son como pequeñas y exquisitas máquinas biológicas. De la misma manera que la estructura de una máquina te dice qué hace, la estructura de una proteína nos ayuda a comprender su función. Hoy, compartimos un tesoro de información que duplica la comprensión de la humanidad del proteoma humano y revela las estructuras de proteínas encontradas en otros 20 organismos biológicamente significativos, desde E.coli hasta levaduras, y desde la mosca de la fruta hasta el ratón.

Este será uno de los conjuntos de datos más importantes desde la secuenciación del Genoma Humano. Ewan Birney, Subdirector General de EMBL y Director de EMBL-EBI

Como una poderosa herramienta que apoya los esfuerzos de los investigadores, creemos que esta es la contribución más significativa que la IA ha hecho hasta ahora para avanzar en el conocimiento científico, y es un gran ejemplo de los beneficios que la IA puede aportar a la humanidad. Estas ideas serán la base de muchos avances emocionantes en nuestra comprensión de la biología y la medicina. Gracias a cinco años de trabajo incansable y mucha ingeniosidad por parte del equipo de AlphaFold, y trabajando en estrecha colaboración durante los últimos meses con nuestros socios en el Instituto Europeo de Bioinformática de EMBL (EMBL-EBI), podemos compartir este recurso enorme y valioso con el mundo.

Anterior Siguiente:

‍ Este último trabajo se basa en los anuncios que hicimos en diciembre, en la conferencia CASP14, cuando DeepMind presentó una nueva versión radical de nuestro sistema AlphaFold, que fue reconocido por los organizadores de la evaluación como una solución al gran desafío de 50 años de comprender la estructura 3D de las proteínas. Determinar las estructuras de las proteínas experimentalmente es una tarea que consume mucho tiempo y requiere mucho esfuerzo, pero AlphaFold demostró que la IA puede predecir con precisión la forma de una proteína, a gran escala y en minutos, con precisión atómica. En CASP, nos comprometimos a compartir nuestros métodos y proporcionar acceso amplio a este cuerpo de conocimiento.

Mejoras en la precisión mediana de las predicciones en la categoría de modelado libre para el mejor equipo en cada CASP, medida como mejor de 5 GDT.

Este mes, hemos terminado la enorme cantidad de trabajo duro para cumplir con ese compromiso. Publicamos dos artículos revisados por pares en Nature ( 1 , 2 ) y compartimos el código de AlphaFold de código abierto . Hoy, en colaboración con EMBL-EBI, estamos increíblemente orgullosos de lanzar la Base de Datos de Estructura de Proteínas AlphaFold, que ofrece la imagen más completa y precisa del proteoma humano hasta la fecha, más que duplicando el conocimiento acumulado por la humanidad de las estructuras de proteínas humanas de alta precisión.

Además del proteoma humano (todas las ~20,000 proteínas expresadas por el genoma humano), estamos proporcionando acceso abierto a los proteomas de otros 20 organismos biológicamente significativos, con más de 350,000 estructuras de proteínas. La investigación sobre estos organismos ha sido objeto de innumerables artículos de investigación y numerosos avances importantes, y ha resultado en una comprensión más profunda de la vida misma. En los próximos meses, planeamos ampliar enormemente la cobertura a casi todas las proteínas secuenciadas conocidas por la ciencia: más de 100 millones de estructuras que cubren la mayoría de la base de datos de referencia UniProt . Es un verdadero almanaque de proteínas del mundo. Y el sistema y la base de datos se actualizarán periódicamente a medida que continuemos invirtiendo en futuras mejoras de AlphaFold.

Lo más emocionante es que, en manos de científicos de todo el mundo, este nuevo almanaque de proteínas permitirá y acelerará la investigación que avanzará en nuestra comprensión de estos bloques fundamentales de la vida. Ya hemos visto señales prometedoras de investigadores que utilizan AlphaFold en su propio trabajo. Por ejemplo, la Iniciativa de Medicamentos para Enfermedades Desatendidas (DNDi) ha avanzado en su investigación sobre curas que salvan vidas para enfermedades que afectan de manera desproporcionada a las partes más pobres del mundo, y el Centro de Innovación de Enzimas de la Universidad de Portsmouth (CEI) está utilizando AlphaFold para ayudar a diseñar enzimas más rápidas para reciclar algunos de nuestros plásticos de un solo uso más contaminantes. Para aquellos científicos que dependen de la determinación experimental de la estructura de las proteínas, las predicciones de AlphaFold han ayudado a acelerar su investigación. Como otro ejemplo, un equipo de la Universidad de Colorado Boulder encuentra prometedor el uso de predicciones de AlphaFold para estudiar la resistencia a los antibióticos, mientras que un grupo de la Universidad de California San Francisco las ha utilizado para aumentar su comprensión de la biología del SARS-CoV-2 . Y esto es solo el comienzo de lo que esperamos sea una revolución en la bioinformática estructural. Con AlphaFold en el mundo, ahora hay un tesoro de datos esperando ser transformados en avances futuros.

AlphaFold abre nuevas perspectivas de investigación, y es inspirador ver cómo la IA de vanguardia permite trabajar en enfermedades que se concentran casi exclusivamente en poblaciones empobrecidas. – Ben Perry, Líder de Innovación Abierta de Descubrimiento, Iniciativa de Medicamentos para Enfermedades Olvidadas (DNDi)

Para el equipo de AlphaFold en DeepMind, este trabajo representa la culminación de cinco años de enorme esfuerzo, incluyendo superar creativamente muchos contratiempos desafiantes, lo que ha resultado en una serie de nuevas y sofisticadas innovaciones algorítmicas que eran necesarias para finalmente resolver el problema. Se basa en los descubrimientos de generaciones de científicos, desde los pioneros en imágenes y cristalografía de proteínas, hasta los miles de especialistas en predicción y biólogos estructurales que han pasado años experimentando con proteínas desde entonces. Nuestro sueño es que AlphaFold, al proporcionar esta comprensión fundamental, ayude a innumerables científicos en su trabajo y abra completamente nuevas vías de descubrimiento científico.

Lo que nos llevó meses y años hacer, AlphaFold pudo hacerlo en un fin de semana. ‍ – Profesor John McGeehan, Profesor de Biología Estructural y Director del Centro, Centro para la Innovación de Enzimas (CEI) de la Universidad de Portsmouth

En DeepMind, nuestra tesis siempre ha sido que la inteligencia artificial puede acelerar drásticamente los avances en muchos campos de la ciencia, y a su vez avanzar en la humanidad. Construimos AlphaFold y la Base de Datos de Estructura de Proteínas de AlphaFold para apoyar y elevar los esfuerzos de los científicos de todo el mundo en el importante trabajo que realizan. Creemos que la IA tiene el potencial de revolucionar la forma en que se hace la ciencia en el siglo XXI, y esperamos con ansias los descubrimientos que AlphaFold podría ayudar a desbloquear a la comunidad científica.

Para obtener más información, diríjase a Nature para leer nuestros artículos revisados por expertos que describen nuestro método completo y el proteoma humano. Puede obtener más información sobre ellos en nuestro blog técnico. Si desea explorar nuestro sistema, aquí tiene el código de código abierto de AlphaFold y el cuaderno de Colab para ejecutar secuencias individuales. Para explorar nuestras estructuras, EMBL-EBI, líder mundial en datos biológicos, las está alojando en una base de datos consultable que está abierta y gratuita para todos.

¡Nos encantaría conocer sus comentarios y entender cómo AlphaFold ha sido útil en su investigación! Comparta sus historias en [email protected].