Esta página ha sido traducida por una máquina. Otras páginas pueden seguir apareciendo en inglés. View in English

Predicción a escala evolutiva de la estructura de las proteínas a nivel atómico con un modelo de lenguaje

  • 0FAIR, Meta AI, New York, NY, USA.
Clinical Neuroscience (new York, N.y.) +

|

|

Resumen

Este resumen es generado por máquina.

Los grandes modelos de lenguaje ahora pueden inferir directamente la estructura de proteínas a nivel atómico a partir de secuencias primarias. Este avance acelera la predicción de la estructura, lo que permite la creación del Atlas Metagenómico ESM con más de 617 millones de estructuras de proteínas.

Área De La Ciencia

  • Biología computacional
  • Inteligencia artificial
  • Biología estructural

Sus Antecedentes

  • Los avances en el aprendizaje automático utilizan información evolutiva en múltiples alineaciones de secuencias para la predicción de la estructura de las proteínas.
  • Los métodos actuales a menudo requieren extensos recursos computacionales y tiempo.

Objetivo Del Estudio

  • Demostrar la inferencia directa de la estructura completa de proteínas a nivel atómico a partir de la secuencia primaria utilizando un modelo de lenguaje grande.
  • Para lograr una aceleración de orden de magnitud en la predicción de estructuras de alta resolución.
  • Para permitir la caracterización estructural a gran escala de las proteínas metagenómicas.

Principales Métodos

  • Utilizó un gran modelo de lenguaje escalado hasta 15 mil millones de parámetros.
  • Entrenó el modelo en secuencias de proteínas para aprender información estructural de resolución atómica dentro de sus representaciones.
  • Aplicó el modelo para predecir estructuras para un gran conjunto de datos de secuencias de proteínas metagenómicas.

Principales Resultados

  • Una imagen de resolución atómica de la estructura de la proteína surgió en las representaciones aprendidas del modelo de lenguaje a escala.
  • Logró una aceleración de orden de magnitud en la predicción de la estructura de proteínas de alta resolución.
  • Construyó con éxito el Atlas Metagenómico ESM, prediciendo estructuras para más de 617 millones de secuencias de proteínas metagenómicas.
  • Identificó más de 225 millones de secuencias de proteínas con predicciones de estructura de alta confianza.

Conclusiones

  • Los grandes modelos de lenguaje ofrecen un enfoque poderoso y eficiente para la predicción directa de la estructura de proteínas a partir de secuencias primarias.
  • Este método acelera significativamente el proceso, permitiendo una caracterización estructural a gran escala sin precedentes de los datos biológicos.
  • El Atlas Metagenómico del ESM proporciona un recurso valioso para explorar la diversidad de las proteínas naturales.

Videos de Conceptos Relacionados

Protein Organization 01:24

6.6K

Proteins are polymers of amino acid residues. They are versatile and responsible for different cellular functions, including DNA replication, molecular transport, catalysis, and structural support. Proteins have a hierarchical structure comprising at least three levels of organization: primary, secondary, and tertiary structure. Some large proteins have a quaternary structure where individual protein subunits are linked together.
The primary structure of a protein is its amino acid sequence....

Conservation of Protein Domains Over Different Proteins 02:26

11.0K

Protein domains are small structurally independent units that are part of a single amino acid chain.  Although these domains are often structurally independent, they may rely on synergistic effects to perform their functions as part of a larger protein. Protein domains may be conserved within the same organism, as well as across different organisms.
A limited set of protein domains often duplicate and recombine during evolution. These domains can be organized in different combinations to...

Protein and Protein Structure 02:15

79.9K

Proteins are one of the most abundant organic molecules in living systems and have the most diverse range of functions of all macromolecules. Proteins may be structural, regulatory, contractile, or protective. They may serve in transport, storage, or membranes; or they may be toxins or enzymes. Their structures, like their functions, vary greatly. They are all, however, amino acid polymers arranged in a linear sequence.
A protein's shape is critical to its function. For example, an enzyme...

Conservation of Protein Domains 02:26

3.1K
Protein and Protein Structures 02:15

10.6K
Predicting Molecular Geometry 02:27

34.6K

VSEPR Theory for Determination of Electron Pair Geometries

The following procedure uses VSEPR theory to determine the electron pair geometries and the molecular structures:


Write the Lewis structure of the molecule or polyatomic ion.
Count the number of electron groups (lone pairs and bonds) around the central atom. A single, double, or triple bond counts as one region of electron density.
Identify the electron-pair geometry based on the number of electron groups: linear, trigonal planar,...