Videos de Conceptos Relacionados
Distance Problem
The Distance Formula
Distance Corrections
Short-distance Transport of Resources
Distance Measurements by Taping
Electronic Distance Measuring Instruments
También podría leer
Artículos Relacionados
Artículos vinculados a este trabajo por autores compartidos, revista y gráfico de citas.
Nevermore: Target-Conditioned Protein-Ligand Representation Learning for Multi-Objective Lead Optimization with Database-Grounded Retrieval.
Regulating genome language models: navigating policy challenges at the intersection of AI and genetics.
A Systematic Review of Secondary Traumatic Stress in School Personnel: A Synthesis of Quantitative Findings.
Correction: Development and extensive sequencing of a broadly-consented Genome in a Bottle matched tumor-normal pair.
Development and extensive sequencing of a broadly-consented Genome in a Bottle matched tumor-normal pair.
Association between intestinal functional disorders and anal fistula: evidence from a retrospective case-control study.
Automated recognition of Meso-Cenozoic foraminifera from Senegalese sedimentary deposits using convolutional neural networks.
Genome-wide analysis of <i>HSP70</i> gene superfamily in kelp (<i>Saccharina japonica</i>): identification, characterization, and heat stress-responsive expression profiles.
Morphological and molecular evidence of the Antarctic sleeper shark <i>Somniosus antarcticus</i> (Somniosidae) in northern Chile.
Video Experimental Relacionado
Updated: Feb 12, 2026

Calibrated Forceps Model of Spinal Cord Compression Injury
Published on: April 24, 2015
Distancia de compresión normalizada para la clasificación del ADN.
Gavin Hearne1, Mohammadsaleh S Refahi1, Haozhe Neil Duan1
1Department of Electrical Engineering, Drexel University, Philadelphia, PA, United States of America.
La distancia de compresión normalizada (NCD) ofrece un método de bajo recurso para el análisis de secuencias genómicas. Este enfoque es prometedor en el etiquetado genético y la clasificación taxonómica, especialmente en escenarios con pocos datos.
Área de la Ciencia:
- La genómica es la genómica.
- La bioinformática es la bioinformática.
- Biología computacional Biología computacional.
Sus antecedentes:
- El análisis de la secuencia genómica es crucial para comprender los sistemas biológicos, incluido el microbioma humano.
- La Distancia de Compresión Normalizada (NCD) es una técnica de bajos recursos que se aproxima a la complejidad de Kolmogorov, mostrando potencial más allá de la clasificación del texto.
- Las herramientas existentes como la búsqueda de secuencias Many-against-Many (MMseqs) y Kraken2 son efectivas, pero pueden consumir muchos recursos.
Objetivo del estudio:
- Explorar la aplicación de un NCD basado en gzip para el etiquetado genético de marcos de lectura abiertos (ORF) y la clasificación taxonómica de lecturas genómicas cortas.
- Evaluar el rendimiento de las ENT como una alternativa a las redes neuronales profundas (DNN) y las herramientas tradicionales de análisis de secuencias en genómica.
- Para evaluar la efectividad de las NCD en tareas de clasificación tanto dentro como fuera de la distribución.
Principales métodos:
- Implementación de un algoritmo de distancia de compresión normalizada (NCD) basado en gzip.
- Aplicación de la NCD para el etiquetado genético de marcos de lectura abiertos (ORF).
- Utilizando NCD para la clasificación taxonómica de lecturas de secuenciación corta.
Principales resultados:
- Logró 0.89 precisión y 0.88 macro-F1 para la clasificación de genes humanos, superando a otros métodos de enfermedades no transmisibles.
- Demostró una precisión de clasificación superior en comparación con las herramientas de alineación y coincidencia exacta en el etiquetado de genes procariotas fuera de distribución.
- Métodos de incrustación de secuencias superados en tareas de etiquetado de genes procariotas en distribución.
Conclusiones:
- Los enfoques basados en la compresión, específicamente las ENT, ofrecen una alternativa efectiva para la clasificación de secuencias genómicas.
- La NCD muestra una fuerza particular en entornos de datos bajos y escenarios fuera de distribución.
- La complejidad computacional es una limitación para conjuntos de datos extremadamente grandes, pero la NCD sigue siendo una estrategia viable de bajos recursos.

