Esta página ha sido traducida por una máquina. Otras páginas pueden seguir apareciendo en inglés. View in English

Priorización basada en la secuencia de los candidatos a i-Motif en el genoma humano

  • 0Department of Science and High Technology, University of Insubria, Como, Italy.

|

|

Resumen

Este resumen es generado por máquina.

Este estudio introduce un método computacional para predecir con precisión las estructuras de ADN de i-motivo, esenciales para la regulación génica. El enfoque refinado identifica candidatos de alto nivel de confianza, reduciendo la carga experimental y ayudando a la investigación del cáncer.

Área De La Ciencia

  • La genómica
  • La bioinformática
  • Biología molecular

Sus Antecedentes

  • Los i-Motifs (iM) son estructuras de ADN de cuatro hebras involucradas en la regulación genética y la estabilidad del genoma.
  • Los métodos actuales de predicción de todo el genoma para iM sufren de baja especificidad y altas tasas de falsos positivos, lo que aumenta la carga de trabajo experimental.

Objetivo Del Estudio

  • Desarrollar un enfoque computacional refinado para la predicción de alto nivel de confianza en todo el genoma de secuencias formadoras de i-motif.
  • Mejorar la especificidad y reducir la tasa de falsos positivos en la identificación de la secuencia i-motif.

Principales Métodos

  • Desarrolló una matriz de similitud específica de posición (PSSM) a partir de múltiples alineaciones de secuencias.
  • Se escaneó el genoma de referencia humano (hg38) en busca de motivos ricos en citosina y se anotaron las secuencias utilizando el PSSM.
  • Se evaluó la significación estadística utilizando pruebas de permutación, pruebas t, corrección Benjamini-Hochberg y puntuaciones Z. Candidatos validados con respecto a los iM y los G-cuadruplexos conocidos (G4) utilizando un clasificador forestal aleatorio.

Principales Resultados

  • Se identificaron 37.075 secuencias candidatas con un fuerte potencial de formación de i-motivo (15-46 nucleótidos).
  • Se demostraron diferencias significativas en las puntuaciones de alineación y la similitud de secuencia entre los IM predichos y los G4 conocidos, lo que confirma la especificidad estructural.
  • Se logró un alto rendimiento de clasificación utilizando un modelo forestal aleatorio entrenado en características de nucleótidos, apoyando la distinción del candidato.

Conclusiones

  • Presenta un método escalable y estadísticamente robusto para enriquecer secuencias de i-motivos biológicamente relevantes.
  • Proporciona un recurso valioso para la validación experimental y el diseño racional de ligandos de orientación de i-motif.
  • Facilita la modulación de la expresión génica para aplicaciones en el cáncer y otras enfermedades.