このページは機械翻訳されています。他のページは英語で表示される場合があります。 View in English

種間ゲノムデータセットの予測を向上させる

  • 0Stanford University.

|

|

まとめ

この要約は機械生成です。

研究者は ゲノミクスのための ディープラーニングモデルを簡素化し 精度を向上させ 費用を削減しました ヒトデータに関する予備訓練と微調整により 種間の性能が向上し 新しいモデルの開発に 経済的アプローチが提供されました

科学分野

  • ゲノミクス
  • コンピュータ生物学
  • 機械学習

背景

  • ディープニューラルネットワーク (DNN) は ヒトの大きなデータセットから ゲノム特性を予測するのに優れています
  • これらのDNNのトレーニングは計算上高価で時間がかかります.
  • 比較可能な大規模なデータセットは,ほとんどの非人間生物では利用できません.

研究 の 目的

  • 効率と精度を高めるために既存のDNNアーキテクチャを修正する.
  • ヒトで訓練されたモデルを様々なゲノム研究に 適用する可能性を評価する.
  • ゲノム予測モデルを開発するための費用対効果の高い方法を確立する.

主な方法

  • 最先端のDNNアーキテクチャを簡素化しました.
  • ヒトゲノムデータで 訓練されたモデルです
  • 様々な組織や種からのゲノムデータセットの微調整モデル.
  • モデルのパフォーマンスに対するトレーニングタスクの数の影響を調査した.

主要な成果

  • 改造されたモデルアーキテクチャは,トレーニング時間と計算コストを削減しながら,精度を改善しました.
  • 人体で予め訓練され,微調整されたモデルは,高い予測精度を達成しました (ピアソン相関は0.8まで).
  • 過剰なトレーニング作業は性能を低下させ,微調整によって部分的に回復することが可能である.

結論

  • 簡素化されたDNNアーキテクチャと 転送学習は効率的なゲノムモデリングを提供します
  • ヒトのデータに関する予備訓練と微調整は,種間および組織間での適用に適した戦略です.
  • 最適なモデルのパフォーマンスを確保するには,訓練課題を慎重に選択することが不可欠です.

関連する概念動画

Evolutionary Relationships through Genome Comparisons 02:54

6.1K

Genome comparison is one of the excellent ways to interpret the evolutionary relationships between organisms. The basic principle of genome comparison is that if two species share a common feature, it is likely encoded by the DNA sequence conserved between both species. The advent of genome sequencing technologies in the late 20th century enabled scientists to understand the concept of conservation of domains between species and helped them to deduce evolutionary relationships across diverse...

Improving Translational Accuracy 02:07

11.8K

Base complementarity between the three base pairs of mRNA codon and the tRNA anticodon is not a failsafe mechanism. Inaccuracies can range from a single mismatch to no correct base pairing at all. The free energy difference between the correct and nearly correct base pairs can be as small as 3 kcal/ mol. With complementarity being the only proofreading step, the estimated error frequency would be one wrong amino acid in every 100 amino acids incorporated. However, error frequencies observed in...

Genomics 02:02

37.4K

Genomics is the science of genomes: it is the study of all the genetic material of an organism. In humans, the genome consists of information carried in 23 pairs of chromosomes in the nucleus, as well as mitochondrial DNA. In genomics, both coding and non-coding DNA is sequenced and analyzed. Genomics allows a better understanding of all living things, their evolution, and their diversity. It has a myriad of uses: for example, to build phylogenetic trees, to improve productivity and...

Multi-species Conserved Sequences 02:51

4.3K

Next-generation sequencing technologies have created large genomic databases of a variety of animals and plants. Ever since the human genome project was completed, scientists studied the genome of primates, mammals, and other phylogenetically distant living beings. Such large-scale  studies have provided new insights into the evolutionary relationship between organisms.
Although the genome of each species varies greatly from each other, a few sequences are highly conserved. Such conserved...