FrontPage
有用情報
- DDBJ への塩基配列の登録は、以下の二つの方法がある。
- BLAST などでもちいられている、low complexity filter algorithm について、以下の 2 つのアルゴリズムが挙げられていた。
- DUST algorithm
- SEG algorithm
- Wootton and Federhen (1993)
- Statistics of local complexity in amino acid sequences and sequence databases
- その他の low complexity 関連論文
- Non-globular domains in protein sequences: automated segmentation using complexity measures
- Discovering simple regions in biological sequences associated with scoring schemes
- 0j.py: a software tool for low complexity proteins and protein domains
- A novel complexity measure for comparative analysis of protein sequences from complete genomes
- Sequence complexity of disordered protein
- Disorder 領域予測
- DISOPRED 関連論文
- Prediction of disordered regions in proteins from position specific score matrices
- Prediction and Functional Analysis of Native Disorder in Proteins from the Three Kingdoms of Life
有用ツールのインストール
- Chime
- &ref(): File not found: "MDLChimeSP6.exe" at page "DDBJing-15th";
- PDB ファイルからタンパク質・核酸の立体構造をグラフィカルに表示するツール。
- Rasmol
- raswin.exe
- PDB ファイルからタンパク質・核酸の立体構造をグラフィカルに表示するツール。
初日
INSDC の概略と DDBJ HP の利用法
- INSDC とは?
- GenBank?, EMBL, DDBJ の協力体制のこと。
SAKURA を用いた塩基配列登録の方法
H-Invitational Database の紹介
二日目
データベース検索実習1 getentry, SRS, ARSA の使い方
データベース検索実習2 FASTA, BLAST の使い方
- 相同性検索とは?
- 相同性と類似性の違い
- 相同性は進化的な関係。類似性は文字列としての関係。
- 配列アライメントの定義
- 2 つの配列を要素ごとに対応付けて並べる操作。
- 同じところと違うところが分かるので、2 つの配列の類似度を計算することができる。
- DDBJ で現在提供している相同性検索プログラム
- BLAST
- blastx や pblastx はアミノ酸配列への翻訳を行っているので、計算時間が掛かってしまう。
- 複雑度の低い配列のマスキングには、DUST プログラム、SEG プログラムが用いられている。
- FASTA
- PSI-BLAST
- SSEARCH
ゲノム配列解析ツールと第三者アノテーション
- 日本語バイオポータルサイト
- GIB
- G-InforBIO
- 質問内容
- G-InforBIO の BlastClust? のクラスタの定義は、"ホモログが ○○ 個以上連続した領域" でしょうか?
- G-InforBIO の BlastClust? は Emsembl Syntenic View みたいなものを得ることを目的としているように思うのだけれど、これは真核生物でも適用可能なのだろうか?
- Alignment View などは、3 種以上の比較も可能なのだろうか?
GTOP の利用法・講義および実習
- GTP とは?
- タンパク質 3000 project の結果を利用して、ゲノム解読済生物種の全タンパク質について立体的アノテーションを行った結果を示す DataBase?.
- 年に 3 回の更新を目指しつつ、年に 2 回くらい更新を行っている。
- 要チェック用語
- reverse PHI-Blast
- Disorder 領域
- 「へリックスやシート等の構造をとらない比較的長い領域」のこと。真核生物において、機能に関連しているとの報告があり、タンパク質立体構造予測の業界では、比較的ホットな話題。Disorder 領域予測プログラムも開発されており、ある程度信頼できるとのこと。
- GTOP の検索について
- KeyWord? Search は時間が掛かる。
- Advanced Search で生物種を指定してあげると、速くて良いよ。
- Master File に、GTOP 情報のほとんど全てが含まれている。Master File は、FTP site に置いてあるよ。
- gene name には様々な呼び方があるので(方言のように)、遺伝子配列を持っていれば、配列で検索するのが、一番確実。
- Phylogenetic-Profile を使うと、「古細菌には存在しないけれど、バクテリアには存在する」などの条件を満たすタンパク質のリストを得ることができる。
分子進化解析入門 (ClustalW)
- DDBJ だと、BLASt 検索結果から ClustalW に飛べて便利!!
- TreeView? は、plylip format であれば系統樹を描いてくれる、便利なプログラム。
DDBJ の展望「生命科学データベースの現状と課題」
- NAR に、DB 特集号や、resource 特集号があるよー。
最新の20件
2006-09-25
2006-09-24
2006-09-22
2006-09-16
2006-09-15
2006-09-14
- counter: 181
- today: 1
- yesterday: 0
- online: 1