study-idea


FrontPage



単語使用頻度分布に基づくゲノム間類似度の計算と進化系統樹の作成

Memo

  • ゲノムに含まれる長さ n の連続塩基を "単語" と定義すると,ゲノム配列ごとに単語の使用頻度の分布を調べることができる.
  • そこで,各ゲノムの単語使用頻度分布を調べ,その分布間の類似度 (距離) を計算することもできる.
  • この単語使用頻度分布による進化系統樹と,分子系統学的系統樹とはどのような関係にあるのだろうか!?

Abstruct

Motivation

Method


Result

  • その1
    • 生物種A,生物種B,・・・,生物種Nそれぞれの染色体をごちゃ混ぜにして,単語使用頻度分布に基づく進化系統樹を作成する.
    • 同種染色体でひとつのクラスターを形成していると,手法の確からしさが向上する.
    • 同種染色体で異なるクラスターに含まれている場合,その染色体はその種において特徴的な染色体であると考察することができる.
  • その2
    • ある一定の長さでゲノム配列をセグメント化し,様々な生物種のセグメントをごちゃ混ぜにして,単語使用頻度分布に基づく進化系統樹を作成する.
    • 多くの同種セグメントがクラスター化されることが期待される.
    • 同種セグメントにも関わらず他のクラスターに含まれている場合,そのクラスターを代表する生物種からの外来配列であることが示唆される.

Discussion