DDBJing-15th


FrontPage



有用情報

  • DDBJ への塩基配列の登録は、以下の二つの方法がある。
    • SAKURA を用いた方法
    • 大量データの一括登録
  • BLAST などでもちいられている、low complexity filter algorithm について、以下の 2 つのアルゴリズムが挙げられていた。
    • DUST algorithm
      • Tatusov and Lipman
    • SEG algorithm
      • Wootton and Federhen (1993)
      • Statistics of local complexity in amino acid sequences and sequence databases
  • その他の low complexity 関連論文
    • Non-globular domains in protein sequences: automated segmentation using complexity measures
    • Discovering simple regions in biological sequences associated with scoring schemes
    • 0j.py: a software tool for low complexity proteins and protein domains
    • A novel complexity measure for comparative analysis of protein sequences from complete genomes
    • Sequence complexity of disordered protein
  • G-InforBIO
  • Disorder 領域予測
    • DISOPRED 関連論文
      • Prediction of disordered regions in proteins from position specific score matrices
      • Prediction and Functional Analysis of Native Disorder in Proteins from the Three Kingdoms of Life

有用ツールのインストール

  • Chime
    • &ref(): File not found: "MDLChimeSP6.exe" at page "DDBJing-15th";
    • PDB ファイルからタンパク質・核酸の立体構造をグラフィカルに表示するツール。
  • Rasmol
    • fileraswin.exe
    • PDB ファイルからタンパク質・核酸の立体構造をグラフィカルに表示するツール。

初日

INSDC の概略と DDBJ HP の利用法

  • INSDC とは?
    • GenBank?, EMBL, DDBJ の協力体制のこと。

SAKURA を用いた塩基配列登録の方法

  • DNA 配列の登録方法
    • SAKURA (http://sakura.ddbj.nig.ac.jp/sakura_ja.html)
      • 短い配列の登録
      • 所定のフォームに入力
    • 大量登録システム
      • 多件数 or 長い配列の登録
      • 登録者がファイルを作成し、E-mail or FTP で送信
  • SAKURA を用いた塩基配列登録
    • 練習用 URL
      • http://uribo.ddbj.nig.ac.jp:8888/sakura_ja.html
      • こんなステキなものを用意しちゃうのが、すごい。サンプルデータもあるから、気軽に練習出来ちゃう。
      • データがそろっていれば、1エントリーあたり、だいたい 10 分程度で登録できる。

H-Invitational Database の紹介

二日目

データベース検索実習1 getentry, SRS, ARSA の使い方

データベース検索実習2 FASTA, BLAST の使い方

  • 相同性検索とは?
    • 相同性と類似性の違い
      • 相同性は進化的な関係。類似性は文字列としての関係。
    • 配列アライメントの定義
      • 2 つの配列を要素ごとに対応付けて並べる操作。
      • 同じところと違うところが分かるので、2 つの配列の類似度を計算することができる。
  • DDBJ で現在提供している相同性検索プログラム
    • BLAST
      • blastx や pblastx はアミノ酸配列への翻訳を行っているので、計算時間が掛かってしまう。
      • 複雑度の低い配列のマスキングには、DUST プログラム、SEG プログラムが用いられている。
    • FASTA
    • PSI-BLAST
    • SSEARCH

ゲノム配列解析ツールと第三者アノテーション

  • 質問内容
    • G-InforBIO の BlastClust? のクラスタの定義は、"ホモログが ○○ 個以上連続した領域" でしょうか?
    • G-InforBIO の BlastClust? は Emsembl Syntenic View みたいなものを得ることを目的としているように思うのだけれど、これは真核生物でも適用可能なのだろうか?
    • Alignment View などは、3 種以上の比較も可能なのだろうか?

GTOP の利用法・講義および実習

  • GTP とは?
    • タンパク質 3000 project の結果を利用して、ゲノム解読済生物種の全タンパク質について立体的アノテーションを行った結果を示す DataBase?.
    • 年に 3 回の更新を目指しつつ、年に 2 回くらい更新を行っている。
  • 要チェック用語
    • reverse PHI-Blast
    • Disorder 領域
      • 「へリックスやシート等の構造をとらない比較的長い領域」のこと。真核生物において、機能に関連しているとの報告があり、タンパク質立体構造予測の業界では、比較的ホットな話題。Disorder 領域予測プログラムも開発されており、ある程度信頼できるとのこと。
  • GTOP の検索について
    • KeyWord? Search は時間が掛かる。
    • Advanced Search で生物種を指定してあげると、速くて良いよ。
    • Master File に、GTOP 情報のほとんど全てが含まれている。Master File は、FTP site に置いてあるよ。
    • gene name には様々な呼び方があるので(方言のように)、遺伝子配列を持っていれば、配列で検索するのが、一番確実。
    • Phylogenetic-Profile を使うと、「古細菌には存在しないけれど、バクテリアには存在する」などの条件を満たすタンパク質のリストを得ることができる。

分子進化解析入門 (ClustalW)

  • DDBJ だと、BLASt 検索結果から ClustalW に飛べて便利!!
  • TreeView? は、plylip format であれば系統樹を描いてくれる、便利なプログラム。

DDBJ の展望「生命科学データベースの現状と課題」

  • NAR に、DB 特集号や、resource 特集号があるよー。
  • 質問内容