neighbor joining method by J7G2UPN

VIEWS: 0 PAGES: 48

									1
           H23 バイオインフォマティックス概論授業予定
         (授業の進み具合によって変更の可能性があります)
      黒字は、講義による解説。青字はウェブを使った実習を示します。
第1回   10 月 4 日    授業概要説明
                  BioInformatics の研究分野、データベースの種類
第2回   10 月 11 日   遺伝子の構造、塩基配列とアミノ酸配列
                  cDNA 塩基配列から蛋白質アミノ酸配列への変換
                  配列データベースについての解説
                  宿題(1)  :配布
第3回   10 月 18 日   ホモロジー検索(BLAST 検索)についての解説
                  BLAST 検索の実習
                  BLAST 検索の結果の見方
第4回   10 月 25 日   タンパク質の構造(シグナルペプチド、疎水・親水性プロット、
                  ドメイン構造)
                  分子量と等電点の予測・シグナルペプチドの予測
                  ドメイン構造の予測
                  宿題(2):配布
第5回   11 月 1 日    研究計画立案、レポート・論文作成に必要な情報収集
                  塩基配列とアミノ酸配列情報の収集
                  文献検索
                  宿題(1):提出
第6回   11 月 8 日    タンパク質/遺伝子の機能に関する情報収集
                  Entrez (NCBI) の利用
                  バイオデータベースの利用
                  宿題(3)配布
第7回   11 月 15 日   配列アライメントについての解説
                  ペアワイズアライメント、多重配列アライメントの作成
                  分子系統樹の有用性
                  分子系統樹の作成(1/2)
                  宿題(2)提出
                  宿題(1)解説
第8回   11 月 22 日   分子系統樹の作成(2/2)
                  分子系統樹の見方
                  ゲノム・遺伝子の重複と遺伝子種の増加について
                  進化とゲノム構造について
                  オルソログとパラログの関係について
                  宿題(4)配布



                              2
第9回      11 月 29 日   遺伝子間相互作用・代謝経路
                     代謝経路データベースの利用
                     宿題(3)提出
                     宿題(2)解説
第 10 回   12 月 6 日    ヒト全ゲノム解読プロジェクトについての解説(1/2)
                     ゲノム解読の行われている生物を調べる(NCBI)
                     MapViewer の利用(1):遺伝子の染色体上の位置を調べる
                     MapViewer の利用(2):ゲノムデータベースでの BLAST 検索


                     宿題(5):配布
第 11 回   12 月 13 日   分子生物学会出席のため鈴木、不在
                     酒井義文先生(本学工学部情報科学出身)による解説
                     Blast 検索、ClustalW、分子系統樹のアルゴリズムと原理
                     隠れマルコフモデルについての解説


第 12 回   12 月 20 日   ヒト全ゲノム解読プロジェクトについての解説(2/2)
                     MapViewer の利用(3):in silico 遺伝子クローニング
                     MapViewer の利用(4):さまざまな生物のゲノムデータベースの
                     利用
                     宿題(4)    :提出
                     宿題(2)解説

第 13 回   1 月 10 日    ポストゲノム研究(1)—比較ゲノム:進化に伴うゲノム構造の
                      変化
                     遺伝子発現量に関する情報の利用:Digital differential display
                     (トランスクリプトーム解析)

第 14 回   1 月 17 日    ポストゲノム研究(2)—全遺伝子の機能解析
                      ポストゲノムのモデル生物について
                     ポストゲノム研究(3)—機能ゲノム学
                      コード領域以外のゲノム配列の機能解析
                     遺伝子の転写調節機構:転写因子が結合するコンセンサス結合配
                      列
                     ゲノム塩基配列をゲノムデータベースから取り出す: Ensembl
                      Genome Browser
                     ゲノムデータベースから取り出した転写調節領域からコンセンサ
                     ス配列を検索する




                                  3
第 15 回   1 月 24 日   ポストゲノム研究(4)—ポジショナルクローニングと QTL 解析
         最終回         におけるゲノム情報の利用
                       ENU による突然変異体の作製
                       突然変異の原因遺伝子のポジショナルクローニング
                    突然変異体のデータベースの利用
                    連鎖地図の利用


                    ポストゲノム研究(5)—生物間のシンテニー解析


                    GFP トランスジェニック体の作製
                    必要なプロモーター領域をゲノムデータベースから入手する
                    宿題(5)提出
                    授業評価




                             4
10 月 4 日(第 1 回)
  第一回目ですので、最初に今年の授業予定を紹介します。この授業では、基本的に各授
業の前半で講義、後半に実習を行います。実習では、ウェブ上で公開されているデータベ
ースやプログラムを使います。今日は、生物学、分子生物学、農学研究に利用できるデー
タベースにどのようなものがあるかを紹介します。
  コンピューター操作に慣れていない学生も多いと思います。今日は、基本的な操作から
実習します。NCBI のプログラムを使って、塩基配列をアミノ酸配列に変換してみます。コ
ンピューター操作に慣れるようにして下さい。
  なおこのテキストでは、その日の授業で行う講義内容とコンピューターを使った実習に
ついて簡単に説明してあります(必要に応じて、プリントアウトして下さい)。講義で使う
パワーポイントの図はプリントしたものを資料として配布します。毎回、翌週のプリント
を配ります。このテキストと配布資料を使って、予習・復習して下さい。


                    講義
 1)授業の予定と進め方
 2)「バイオインフォマティックス」とは?
 3)データベースのいろいろ




                     5
10 月 11 日(第 2 回)
   4)遺伝子の構造についての復習
         ————————————————————————————————
                               実習
                    cDNA 塩基配列をアミノ酸配列に変換する


 1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center)
                          http://www.ncbi.nlm.nih.gov/


 2)使用するアイコン:ORF finder (open reading frame =         蛋白質をコードする塩基
                    配列の読み取り枠)


                                    検索手順
      1. NCBI のウェブサイトを開き、1ページ左 All resources (A-Z)をクリック
      2. Open reading frame finder(ORF finder)を開ける


      3.アミノ酸配列に変換する
        配列(FASTA format)を枠内にコピーする
          OrfFind ボタンを押す
          青で示されたのが、予想されるアミノ酸配列(センス、アンチセンス鎖そ
                        れぞれ3フレームで検索された結果が示される)
          一番長いフレームがコードするアミノ酸配列になる
          青のバーをクリックする=塩基配列とアミノ酸配列が表示される


      4.推定されたアミノ酸配列を取り出すには
        Accept ボタンを押す
          View ボタンを押す
          アミノ酸配列を Word にコピーする


     FASTA format
       塩基配列とアミノ酸配列のファイルフォーム。「>」で始まる1行がコメント(遺
       伝子名や任意の番号やコメント)を記述するために用意されており、続く2行目
       から塩基配列あるいはアミノ酸配列を記述する。最後に改行して「//」を記載し、
       1つの配列の記述が完了する(この記号はなくてもよい)。ホモロジー検索、多重
       アライメント作成等で使う。


                      練習
 テストシークエンスを使って、練習してみよう
 >test_DNA_sequence-1
                                    6
AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTCTTTTTTGTAAAATTCTATAATTTAGCTAAAATGA

CTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGG

AATGGACCAGACGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTTCAGAAATTCACCAAGTCGAGGCGC

GTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAAACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGA

AGAAAGTGGTGCACAAAAGCGAGCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACAGCGCATAACGGAG

GAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTG

CGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGCCA

AAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA

//



>test_DNA_sequence-2
ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGCCTGCTGTTCACTGTGCTGTGTGAGGCA

GCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGACAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAA

GAACCTGAAGCTGATAACTCTGCATAATTTGGAGGCGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAG

CTGTAACTCGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAAGGGCTATGTCACAGAAGTC

AAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGAAGACTCAGGGAACACTTGTATCCCTCAGCCCTCAGAACCTGGTTGA

CTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTCATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCA

TGGAAGAACAATGCAGATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCACTGTTGGACCA

ATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACCCAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGG

TACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCCTTTTGGGGAACAGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGT

ATGCCTGCTACCCCATTATGTGACGACCTGAAGCAAAGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGAATA

CTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA

//




                                                       7
 10 月 18 日(第 3 回)
   分子生物学研究で使う機会が最も多いプログラムが、   塩基配列やアミノ酸配列のホモ
 ロジー(相同性)検索プログラムです。新しい遺伝子を発見した時、最初に行う操作が
 相同性検索だからです。相同性検索では、クローニングした遺伝子が、データベースに
 登録されているどの遺伝子に類似しているかを調べます。授業では、BLAST プログラム
 を用います。今日は、塩基配列・アミノ酸配列のデータベース、問い合わせ配列とデー
 タベースの組合せ、各組合せで使う BLAST プログラムについて説明します。そのあとテ
 スト配列を使って、実際に BLAST 検索を行います。


                                     講義


                   ホモロジー(homology)検索
    問い合わせ配列(query sequence)に対し、類似した配列をデータベースから探し出
    す操作。最も高頻度に利用されるバイオインフォマティックスの手法のひとつ。

    検索内容:実験でクローニングした cDNA、あるいはそれがコードするアミノ酸配列
    がデータベースに登録されている遺伝子、蛋白質のどれと類似するか?


       遺伝子配列データベース:GenBank, DDBJ, EMBL


    最も広く利用されており、検索が高速なプログラムが BLAST


    検索の組合せ  問い合わせ配列 対 データベース
    BLASTN   塩基配列 対 塩基配列データベース
    BLASTP アミノ酸配列 対 アミノ酸配列データベース
    BLASTX 塩基配列(アミノ酸配列に置換) 対 アミノ酸配列データベース
    TBLASTN      アミノ酸配列 対 塩基配列データベース(アミノ酸配列に置換)
    TBLASTX    塩基配列(アミノ酸配列に置換) 対 塩基配列データベース塩基配列(アミノ酸配列に置換)


 **************************************************************************
                 BLAST 検索の原理
1.ホモロジーが観察される配列間の局所アライメントには、多くの場合、ギャップを含
  まない保存領域が存在する。BLAST では、そのような局所保存領域(ワード)をまず
  高速に検索する。
2.一致したワードからアライメントを配列に沿ってそれぞれの方向に拡張していき、ス
  コアが増加するまで続ける。拡張処理は、スコアの増加が止まり、伸ばす前のベスト
  スコアより減少し始めた時に終了する。      HSP
                    この時点で、 (high-scoring segment pair)
  と呼ばれる、大きな配列領域が見つかる。この時点でギャップがあるとそこから先に
  は伸長していない。
                                     8
3.一般に、アミノ酸配列と塩基配列にはギャップが生じているため、HSP のみでは類似
  領域の検索として不十分である。そこで、BLAST では、HSP において対応する位置に存
  在する 1 組の記号のペアを適切に選び、類似度の高い領域はこのペアを含むものと仮
  定して、動的計画法と呼ばれる方法を用いて類似領域を探索する。HSP から選んだペ
  アを起点として探索範囲を狭く取ることによって、類似度の最適性は保証されないも
  のの、従来の動的計画法と比較して高速な類似領域の探索を実現している。


スコア:
アミノ酸配列の場合:BLOSUM62 スコア(アミノ酸の組合せによって値が決められている)
塩基配列の場合:値は同じ塩基、異なる塩基の組合せでのみ決められている
     ————————————————————————————————
                                     実習


使用するウェブサイト:NCBI
   使用するアイコン:BLAST
                            検索手順 (BLASTP の場合)
       1.NCBI、All Resources (A-Z)の中から BLAST (Basic Local Alignment Search
         Tool)を選択する。Basic BLAST に上記4種類の BLAST プログラムのアイコ
         ンがある。
       2.protein blast をクリックする。アミノ酸配列(FASTA format)を枠内にコ
         ピーする。Chooose Search Set, Program Selection は、デフォルトのまま
         でよい。
       3.BLAST のボタンを押して、検索を開始する。


 >test_sequence_blast
 TGAATGAACTGTCATGTCAGGAACATGCTCTGCCTGTCTCAGAGATTGCAAGTCAAATTCAGAGCATACTTCGCTAT
 CATAATCTTGATTGCCGTTCAGTTAGTGCAACCAACAATGTCATGCAAGAACGAAAACCGCAGCCAGCGTCTTCACC
 GAAGTCTGAAGCTCAACAAGTTTACAAACAAGATGACAGTGAAGCTCTTGGACATATATAAAGCCAGTCAAGGAGAC
 TCTACAGACCTGATCTGTGAAATGCAAATGGACAATGTTCCAGTGTCTACAATCTCCGGTCAGACTGAATCGGAGCG
 CATCTTAAGTATGTATTCCCACCTGAAGGCGTTTCTGCCACACCTGAAGACAGTGATGGAGCAGCAGCGGGATCCTC
 CaACCAACCCCGTGACAGAGGGAATTAACAGCTTGATTACACACgTTCGCCACATGGCTGTAAGGGTGAACTGTCTC
 TTACAAATCCTGCAGCCAAATATACCCATTCCTGAGCCAGCTGAAAGGCCAACGGGAATTCCCCCAGCGCaGAATAT
 TTTCCAGCAGAAGGTcTATGGATGCATCGTCCTAACTCGGCTTCAGCAGCTCCTTAGTCAAGCAGTTCAAGaACAAA
 AGTCTCTcAAGGGAAAAACCTGCAGGAGGACTAAAAAGAATTATTCTTGATCAACTCAAACTTGTTCTGTTATGTAA
 GACCACGTAATTTATTATTAATATTTATTTTTGTACTGTTTATAAGAAATGTTTTCTGTAcAAGTGTCCTCTTTTGC
 AA




                                      9
                               練習
blastp で相同タンパク質の検索を試してみよう
        利用例:単離した遺伝子がコードするアミノ酸配列が、           既知のどのタンパク質
        の配列に類似するか?
         練習:bastp を開ける。
            先週の>test_sequence-blast から推定されたアミノ酸配列を検索して
            みよう


blastn で相同遺伝子の検索を試してみよう
       データベースが、デフォルトではヒトゲノムになっているので、nucleotide
       collection (nr/nt)を選択すること。また Program selection で somewhat
       similar sequences (blastn)を選択する。
        利用例:単離した遺伝子が、既知のどの遺伝子の配列に類似するか?
              練習:bastn を開ける。先週の>test_DNA_sequence-1 の塩基配列で検
              索してみよう


blastn を試してみよう
           :
        利用例 単離した遺伝子がコードするアミノ酸配列と相同性の高い蛋白質を探
        す。問い合わせの塩基配列は、3フレームで翻訳されて、そのあと検索にかけ
        られている。クローニングした遺伝子がコードするの相同蛋白質を進化的に
        離れた生物から探す場合に、非常に有効。
           練習:tbastn を開ける。先週の>test_DNA_sequence-1 の塩基配列で検
           索してみよう


tblastn を試してみよう
           :
        利用例 単離した遺伝子がコードするアミノ酸配列と相同性の高いアミノ酸配
        列をコードする塩基配列を探す。    問い合わせの塩基配列、        データベースの塩基
        配列とも3フレームで翻訳されて、    そのあと検索にかけられている。           クローニ
        ングした遺伝子の相同遺伝子を進化的に離れた生物から探す場合に、非常に
        有効。
            練習:tbastn を開ける。先週の>test_DNA_sequence-1 の塩基配列で検
            索してみよう


   同じ遺伝子の配列なのに、それぞれの検索で引っかかってくる遺伝子・蛋白質の数
   が違うことに注意!


>zebrafish_PCNA
ACTTTAGTTCCTCCTACTCCAAACTAAGAAAGCAGCACAATGTTTGAGGCACGTCTGGTTCAGGGATCTATCCTTAA
GAAGGTCCTGGAGGCTCTGAAAGACCTGATCACCGAGGCTTGCTGGGATGTGAGCTCGTCGGGCATTTCTCTGCAGA
                                    10
GTATGGACTCCTCTCATGTGTCTCTGGTGCAGCTGACGCTCCGGAGTGACGGGTTCGACTCCTACCGCTGCGACAGA
AACCTAGCCATGGGGGTCAATCTGAGCAGCATGTCGAAGATTCTGAAGTGTGCTGGAAATGAAGACATCCAGACACT
TAGAGCTGAAGACAATGCTGACACGCTGGCACTGGTCTTTGAAGCTCAAAATCAGGAGAAAGTGTCCGACTATGAGA
TGAAACTGATGGATCTGGATGTGGAGCAGCTTGGCATTCCAGAGCAGGAATACAGTTGTGTGGTGAAGATGCCGTCG
GGTGAGTTTGCCCGCATCTGCAGGGATCTGTCACAGATTGGTGATGCTGTCATGATCTCGTGTGCCAAGGATGGCGT
GAAGTTCTCTGCTAGCGGAGAGCTGGGCACAGGCAACATCAAGCTCTCACAGACCAGCAATGTCGACAAGGAGGATG
AAGCGGTAACAATTGAGATGAATGAGCCAGTGCAGCTCATTTTTGCATTGAACTACCTGAACTTCTTCACCAAGCCA
ACTCCTCTGTCCAGAACGGTCACACTTAGAATGTCCGCACATATTCCACTAGTGGTTGAGGACAAAATTGCAGACCT
TGAACACGTAAAATATTACCTGGCGCCCCAGATCGAGGATGAAGAGTCCTCCTAATCCAAGCAGAAGAGCGAAGCCT
GTCATCTGTGGGATTTTCATTCTGCAACTCAGAAGTTATTGCATAGATGTTTTGGGAAAATGCATTTTATTACTCAG
TGTCTGCTGTGGTTTCCAGTTCAATGGATTCCCGATTGTGACCCTCTAAAGCCATTACATATCATTGGCAGAATTGC
GGGCGCACTTATTAAATGATGGTAGTTTGGGCCTTAGCTTTACCAGGCGCTCCGTGGGCTGAATCTAGAGTGCTCTC
ATGTACATACTCCACATTCAGTCTTGTTTTTCTCCCTTTTTGCCGTTGTCCTCTTGTGTCCATTTCAGGTTTTGTCC
AACTGCTCATTCCAATGTGTAGATAATTGTCTGTAAATATGCTAATTGGACACCGTTCATCCAGTCAACCCGTAATA
AAACTGTTGTATCGG
    PCNA は、バクテリアからヒトまで配列の保存性が非常に高い。この配列で BLASTN
    検索して、上の検索結果との違いを考えてみよう。


検索結果の見方:
   e-value:検索結果は、Query 配列と相同性を示す配列のアライメント結果が表
     示される。e-value は、検索に使ったデータベースのなかで、Query の局所配
     列と検索配列の組合わせが、     偶然にみつかる個数を示す。相同性が高いほど、
     値は 0 に近づく。
   score (bits): 検索されてきた局所配列の長さをビット形式で示したもの。値
     が大きいほど、相同性を示す領域が長い。
   Gaps:アライメントされた配列で、    片一方で欠損している塩基あるいはアミノ酸
        の総計
      Identities:アミノ酸配列で、相同領域のなかで一致しているアミノ酸の比率
      Positives: アミノ酸配列で、一致しているアミノ酸+化学的に類似するアミノ
        酸の比率




                                    11
10 月 25 日(第 4 回)


 クローニングした遺伝子の塩基配列からアミノ酸配列が推定できれば、各種プログラム
を使って、遺伝子がコードするタンパク質の構造的な特徴を予測することができます。今
日の授業では、シグナルペプチド、ドメイン構造について解説したあと、テスト配列を使
って実際にこれら構造の検索   (分子量、等電点、シグナルペプチド、疎水性・親水性領域、
ドメイン構造)を行います。主なモチーフ検索サイトには、Pfam と EBI がありますが、そ
れぞれ特徴があります。   ドメインの検索には Pfam が優れます。糖鎖結合部位やリン酸化部
位の検索では EBI を使います。


シグナルペプチド
分泌性の蛋白質の N 末端に存在する、15-30 残基の疎水性アミノ酸から構成されたシグナ
ル配列。分泌前に、シグナルペプチダーゼによって切断される。

タンパク質のドメイン(モチーフ)構造
ドメイン構造(=モチーフ):タンパク質のアミノ酸配列のなかで、特有な性質を持った領
域。分子の構造上あるいは機能上一つのまとまりを持つ領域。


  ドメイン構造の例
    細胞膜レセプター:リガンド結合ドメイン、細胞膜貫通ドメイン、チロシンキナ
            ーゼドメイン、リン酸化ドメイン
    核レセプター:リガンド結合ドメイン、DNA 結合ドメイン
    酵素:活性中心



                                実習


                            基本構造の解析


タンパク質の分子量・等電点の予測:
  1)ExPaSy Proteomics tools (http://ca.expasy.org/)を開ける
  2)Tools & Software の Proteomics tools を開ける
  3)Primary structural analysis の Compute PI/Mw を開ける
  4)下記の>test_DNA_sequence-1-translated_protein_seq で検索してみよう。アミノ酸
    配列を枠内にコピーする(配列のみ)                。Click here to computepI/Mw ボタンをク
       リックする。


                       疎水性・親水性領域の解析


                                 12
   1)ExPaSy Proteomics tools (http://ca.expasy.org/)を開ける
   2)Primary structural analysis の ProtScale を開ける
   3)アミノ酸配列を枠内にコピーする。Hphob. / Kyte &Doolittle を選択する。
   4)Submit ボタンを押す




                                   シグナルペプチドの予測


タンパク質のシグナルペプチドの予測:
  1)SignalP 3.0 Server(http://www.cbs.dtu.dk/services/SignalP/)を開ける
  2)>test_DNA_sequence-1-translated_protein_seq で検索してみよう。アミノ酸配列を
    枠内にコピーする。Submit ボタンをクリックする。

        >test_DNA_sequence-1-translated_protein_seq
        MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPF

        RNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMN

        KQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGS

        EVRERRVLIVEECKCETSSEEAKVQNTDMFNL

        //



             練習:下のアミノ酸配列でも検索してみよう
             >mouse_vitamin_D_receptor
             MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCV

             DIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRP

             TLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQI

             VLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPG

             VQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

             (ビタミンD受容体は、核に移行する蛋白質なのでシグナルペプチドは検出
             されない)


                                      ドメインの予測
タンパク質のドメイン構造の予測(1/2):Pfam を使う
 今日は、下のマウスのビタミンD受容体で検索します。
  1)Pfam(http://pfam.sanger.ac.uk/)を開ける
  2)SEQUENCE SEARCH ボタンを押す
  3)枠内にアミノ酸配列をコピーし、submit を押す
  4)みつかったドメイン構造が左側に示される
                                               13
   5)一番右の Show/hide alignment を押すと、データベースに納められているドメイ
     ン配列と問い合わせ配列のアライメントが表示される
   6)ドメインネーム(上のグラフィックも同様)がアクティブで、それを押すと、ド
     メインの説明、立体構図が表示される
   7)右上のグラフィックツールのうち、structures を押すと、みつかったタンパク質
     の高次構造がグラフィックで示される。PBD ID を押すと、タンパク質の高次構造
     (アルファへリックス構造等)が表示される。


   なお、Borwse ボタンから FAMILIES に入ると、蛋白質名から直接、高次構造の情報を入
       手することもできる。



   >mouse_vitamin_D_receptor
     MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKE

     FILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDL

     YTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTL

     DDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPP

     PGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

       終わった人は、次のタンパク質で検索してみよう:
         ゼブラフィッシュ・FGF レセプター

   >zebrafish_fgfr1
     MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRNDQMEIEKVEPADSGL

     YACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVPASKTVKFRCQANGNPTPTLKWLKNGKEFKR

     DQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLDVVERSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLK

     HIEVNGSRYGPDGLPYVRALKTAGVNTTDKEMEVLQIRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFF

     LICVMVGTAVLAKMHSSAKKSDFNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDR

     LVLGKPLGEGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGPLYVIVEFAAKGNL

     REYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTEDNVMKIADFGLARDIHHIDYYKKTTNGR

     LPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELFKLLKEGHRMDRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVED

     LDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSSTCSSGEDSVFSHDAGADEPCLPKFPPHPNRGVAFKKR



タンパク質のドメイン構造の予測(2/2:EBI を使う)
  1)European Bioinformatics Institute(http://www.ebi.ac.uk/Information/)を開ける
  2)Tools をクリックし、Protein Functional analysis のなかの PPSearch を開ける
   3)no を3カ所とも yes にする
   4)アミノ酸配列 (Fasta format で名前、>++++、も入力すること) を枠内にコピー
     する。今日は、上のゼブラフィッシュ FGF 受容体で検索してみよう。Run ボタン
     をクリックする
                                              14
 ***************************************************************************
                                     参考

         付加される化学基         標的アミノ酸

N-グリコシル化:    複合糖質         Asn-X-(Ser/Thr) 小胞体内で起こる。Xはプロリン以外のアミノ酸

リン酸化:          PO4-,       Tyr, Ser, Thr        特異的プロテインキナーゼによる

ミリストイル化:C14 の脂質アシル化       N 末端の Gly             膜アンカーとしてはたらく




                                           15
11 月 1 日(第 5 回)

                    配列情報と文献の検索
 クローニングした遺伝子を BLAST 検索し、他の生物で相同性の高い遺伝子配列が見つか
った場合、通常、相同遺伝子の機能が論文の形で出版されています。その論文を読めば、
クローニングした遺伝子の持つ機能の概要を知ることができます。データベースを利用す
れば、この様な情報も簡単に収集できます。


 一方、研究計画を立てる場合、その研究に関連した論文をリストアップして、既に報告
されている成果を調べておくことが必要不可欠です。この操作により、これから進める研
究テーマについて、どこまで研究が進んでいるのか、何が分かっていないのかを調べる訳
です。そして未知の事柄を解明するのに、最も有効な計画を立案します。もちろん研究で
遺伝子を扱う場合、その遺伝子の配列、これまでに分かっている性質を調べておくことも
重要です。

 また卒業論文や投稿用論文では、緒言に研究の歴史と背景、意義を述べ、考察では実験
結果と既知の成果を比較検討し、研究で得られた新しい知見を議論します。論文を仕上げ
る時にも、関連論文を収集して精査する必要があります。さらにクローニングした遺伝子
と関連遺伝子とのアライメントを行ったり、分子系統樹を作成する時には、関連遺伝子を
データベースから引き出してくる必要があります。


今日は、研究計画を立てる時や論文を書く際に必要な、データベースからの遺伝子の塩基
配列・コード配列、論文の検索、機能情報の収集操作について実習します。分子系統樹の
作成実習は次週に行います。


                            実習


                    塩基配列・アミノ酸配列の検索


使用するウェブサイト:NCBI.          Search から Nucleotide を選択する
 1.キーワード検索
     例:cow, prion でキーワード検索してみよう
       Core Nucleotide records の左に示されている数字が cow, prion に関連し
       たデータ数で、この数字をクリックすると全てのデータがリストされる。
          必要な配列を見つけて、アクセッション番号をクリックすると、塩基配列
          情報、アミノ酸配列等の情報が表示される。配列情報を別のファイルにコ
          ピーする。


                            16
 2.アクセッション番号による検索
    accession number=DDBJ/EMBL/GenBank 国際塩基配列データベースにおいて各登
    録単位(エントリー)に発行されるエントリー識別子(entry identification,
    ID)を指す。
        例:NM_181015 で検索してみよう

 ページに示されているデータ:
   遺伝子名、生物名、学名、遺伝子座、遺伝子クローニングを行った論文リスト、翻
      ・
   訳開始 終了点、ドメイン構造、塩基配列、アミノ酸配列(PP のスライドは、zebrafish,
   prion (NM_205586)のデータです)


   なお表示結果の詳細な説明は、次のサイトで閲覧できます。
    http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html

                           文献の検索


使用するウェブサイト:NCBI
   使用するアイテム: PubMed
      生物名や遺伝子名でキーワード検索、また人名で検索することができます。キ
      ーワードを入力し(2つ以上の場合、ピリオド、スペースを入れる)検索する
      と、すぐに結果が表示されます。
       ワードの間に and, or, not を使って絞り込みもできます。またキーワードの
      あとに修飾子を使って分野を絞り込むこともできます。著者名[au]、論文タイ
      トル[ti]、ジャーナル名[ta]、出版日時[dp]


       練習:生物名、遺伝子名で検索してみよう
              cow, prion でキーワード検索


      検索結果には、新しい論文から順に、著者名、論文タイトル、雑誌名・刊号・
      ページが表示される。著者名がアクティブで、クリックすると論文の要旨
      (Abstract) が表示されます。Abstract には、論文の概要が記載されている。
      Related Links をクリックすると、この論文と関連する論文リストが表示され
      ています。このシステムを旨く利用すると、一挙に必要な論文をほぼ網羅的に
      収集することができます。必要な論文の原本は、大学図書館の電子ジャーナル
      のサイト等からダウンロードできます。一部ですが、PubMed から無料でダウン
      ロードできるようにリンクされている論文もあります。


       練習:人名で検索してみよう
        Family name と given name 頭文字で、人名のセットとなります。
                               17
           例:Suzuki Tohru = suzuki t
           例:John H. Postlethwait = postlethwait jh
               練習:suzuki t, postlethwait jh でキーワード検索


        練習:人名と遺伝子名で検索してみよう
         例:suzuki t, charon


BLAST 検索結果から、検索した遺伝子に関する文献情報を収集することもできます。リス
トアップされてきた遺伝子の名称がアクティブで、それをクリックすると配列情報に加え
て、 PUBMED の番号を添えた形で関連の論文もリストアップされています。PUBMED 番号をク
リックすると文献情報に入ることができます。
4 ページの>test_sequence-2 で試してみよう。




                「電子ジャーナル」へのアクセスの方法
   東北大学ホームページ→東北大学付属図書館→電子ジャーナル(学内者限定)→雑誌
   名のキーワード検索 OR アルファベット順で検索→volume, page 入力・検索



                      「Scopus」を使った検索
「使用方法」
東北大学付属図書館→資料検索→データベース・ツールインデックス→Scopus


「Scorpus の特徴」
   PubMed では、医学に関係した論文を中心にデータベース化しており、生態学や資源学
  の雑誌は、データに登録されていないことが多い。Scorpus では、ほぼ全ての分野の論
  文が、データとして収められているため、生態学や資源学の研究分野では利用価値が
  高い。


キーワードで文献を網羅的に収集できる
Search field で Abstract を選択→Add search field で検索項目を 3 個程度に増やす→調
べたい内容で代表的なキーワードを入力→検索




                              18
11 月 8 日(第 6 回)


 論文や単行書を読んで機能が分からない遺伝子(タンパク質)がでてきた時には、それ
らの機能を調べる必要があります。遺伝子機能の検索で最も一般的に利用されているサイ
トに NCBI の OMIM (Online Menderian Inheritance in Man)があります。


 OMIM 以外に、ポストゲノムのモデル生物(マウス、ゼブラフィッシュ、シロイズナズナ
等)の検索サイトも重宝します。これらは、バイオデータベースと呼ばれます。モデル生
物のなかでも、特にマウスとゼブラフィッシュのデータベースが充実しており、遺伝子の
機能だけでなく発現パターン(遺伝子が何時、どの組織で、どれだけの量が発現するか)
もデータベースに整理されており、遺伝子名でキーワード検索することができます。
 マウスのデータベースの特徴として、遺伝子ごとにノックアウトマウスの表現型がデー
タベース化されており、表現型から遺伝子の機能を調べることができます。マウスのデー
タベースでは、遺伝子の正確なマップポジション等も示されています。
 ゼブラフィッシュのデータベースには、in situ ハイブリダイゼーションによる発現解
析のデータが写真で掲載されており、発現部位に関する組織レベルの情報を得ることがで
きる特徴があります。脊椎動物中であればオルソログ遺伝子の発現パターンは類似してい
ることが多いので、マウス、ウシやニワトリを研究対象にする場合でも参考となります。


授業では、NCBI の OMIM とマウス・ゼブラフィッシュのウェブサイトを使って、遺伝子の
機能検索を実習します。


                         遺伝子の機能検索


OMIM の使い方
    1.NCBI を開け、All Resources から OMIM を選択する
   2.枠内に遺伝子名を入力して検索
      練習に growth hormone(成長ホルモン)を検索してみよう
      遺伝子の機能、変異に伴う疾患、タンパク質の構造、関連論文がまとめられて
      いる。


ポストゲノム研究のモデル生物のウェブサイトを利用してみよう。これまでの研究によっ
  て明らかにされている遺伝子の機能が検索できる。
 1.マウス
    mouse genome informatics: http://www.informatics.jax.org/
       Search Menu から Genes を選択(全ての情報にリンク)
       Genes & Markers Query を選択
       Gene/Marker Symbol/Name の枠に、遺伝子名を入力して検索:リスとされた遺伝
       子から、目的のものを選択
                               19
         試しに Pax6(眼の発生の上流にある転写因子)を入力してみよう
          Pax6 と言うワードを含む遺伝子リストが表示される。Pax6 を選択する


            得られる情報
             Symbol/Name/ID:遺伝子の正式名称、略記
             Synonyms:同義語(別名)
             Genetic map:遺伝子の連鎖地図上の位置
             Sequence Map:遺伝子の物理地図上の位置
             Mammalian Homology:哺乳類の相同・類似遺伝子
               Sequences:ゲノム塩基配列・cDNA 塩基配列・アミノ酸配列情報
               Phenotypes; ノックアウトマウスの表現型。遺伝子の生物機能が分かる
               Polymorphism: 系統間で見られる配列多型。SNPs(1塩基多型)等
               Gene Ontology (GO):遺伝子の機能、構造
               Expression:発現する組織のリスト
               Protein Domains:転写産物が持つドメイン構造のリスト
               References:関連文献


  2.ゼブラフィッシュ
       The Zebrafish Model Organism Database:http://zfin.org/
         Genes/Makers/Clones を開ける
         Name/Symbol に遺伝子名を入力して検索


         試しに pax6 と入力して検索してみよう。
             2 Genes を開けて、pax6b を選択する


             得られる情報
               Expression:遺伝子発現部位
               Phenotype:突然変異体あるいは遺伝子ノックダウンの表現型
               Map:染色体上の位置。Individual Panels を開けてみよう



                                  ENTREZ の利用
NCBI (http://www.ncbi.nlm.nih.gov/)には、キーワードで全てのデータベースを一挙に検
索するツール ENTREZ があります。           ENTREZ でキーワード検索すると、配列情報、文献情報、
OMIM、OMIA、立体構造等々のデータがもれなく検索されてきます。ENTREZ を利用すれば、
タンパク質の構造や遺伝病等に関する情報を一挙に入手することができ、非常に便利な検
索システムといえます。
*****************************************************************************
11 月 15 日(第 7 回)
                                     20
                            講義


 2つあるいは3つ以上の塩基配列あるいはアミノ酸配列を比較したい場合、アライメン
トプログラムを使います。タンパク質の場合、アミノ酸配列をアライメントにかけること
により、保存性の高い領域を知ることができます。系統的に隔たった生物間(例えば、マ
ウスとゼブラフィッシュ、あるいはマウスと酵母の関係等)で保存性が高い領域は、タン
パク質の機能で重要な役割を持った領域であることが考えられます。ジスルフィド結合を
つくるシステイン残基も保存性が高い配列です。ClustalW プログラムを使うと、マルチプ
ルアライメントの結果から分子系統樹を作成できます。分子系統樹では、遺伝子の進化的
関係を知ることができます。さらに他の生物の相同遺伝子(オーソログ)も特定できます。
モデル生物(マウス、ゼブラフィッシュ)の配列を分子系統樹に加えることで、研究対象
の遺伝子に対するモデル生物のオーソログを検索し、モデル生物の情報からから、研究対
象の遺伝子の機能についておおよその情報を得ることができます。授業では、ペアワイズ
アライメント、マルチプルアライメントおよび分子系統樹の作成を実習します。




                             講義
配列アラインメント
 配列アラインメントとは、配列中で同じ並び方をしている文字列を探すことである。同
 一もしくは似た文字は同じ列に置き、同一でない文字は同じ列に不一致として置くか、
 ギャップを入れる。


    ペアワイズアラインメント (pairwise alignment):2つの配列の比較
      大域的アラインメント (global pairwise alignment)
      局所的アラインメント (local pairwise alignment)
    多重配列アラインメント (multiple alignment):3つ以上の配列の比較


分子系統樹(進化系統樹)(molecular phylogenetic tree, evolutionary tree)
 塩基配列やアミノ酸配列を基に分岐位置と分岐時間を推定し、構築された系統樹
   近接接合法 (neighbor-joining method): 距離行列法で作成する分子系統樹の作
   成方法で、生物分野で最も一般的に利用される。
     キーワード
          節、枝、クラスター (cluster)あるいはクレード(clade)
          Bootstrap value(ブーツストラップ値)
          Evolutionary distance
          Outgroup
                             21
   分子系統樹の利用
     (1)遺伝子ファミリーのメンバーの同種間・異種間での系統関係の解析
     (2)重複遺伝子の相同性、分岐関係の解析(重複時期等についての情報)
     (3)種の系統関係の推定


                                                 実習


                                        multiple alignment
Pairwise alignment
        1)使用するウェブサイト:http://www.ebi.ac.uk/Information/
        2)Tool box の中から Sequence analysis、Align をクリック
        3)sequence 1, sequence 2 の枠内に配列をペーストして RUN
                練習:下の gnrh (gonadotropin-releasing hormone; 生腺刺激ホルモ
                ン)のうち2つを選んでアラインメントを実行してみよう。


Multiple alignment
        1)使用するウェブサイト:http://www.ebi.ac.uk/Information/
          2)Tool box の中から Sequence analysis、ClustalW2 をクリック
          3)配列 (Fasta format) をペーストして RUN(各種ボタンはデフォルトで)
               練習:下の gnrh (gonadotropin-releasing hormone; 生腺刺激ホルモン
               のうち、>ciona_gnrh1(ホヤ)を除く配列でアラインメントを実行し
               てみよう。
               次に、>ciona_gnrh1 を入れてアラインメントを実行し、結果を比べて
               みよう。
               (このサイトでの検索でも系統樹が表示されるが、                 実習・宿題では次ペー
                  ジの http://clustalw.genome.jp/を使うこと)
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSSQHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI

>mouse_Gnrh
MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEARQKKM

>chicken_Gnrh1
MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEGEARRKEI

>xenopus_GnRH1
MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGENRKKI

>zebrafish_gnrh2
MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKRK

>ciona_gnrh1
MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVNARQHWSYEFMPGGR

                                                 22
RAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGMPEEPFKVEQPRPRNGIHGPAGLDQNEPD

WKNWMNEQPAVSSDDKGSDVE




                                                 23
11 月 22 日(第 8 回)


                             分子系統樹の作製


ClustalW で分子系統樹を作成する
   1)使用するウェブサイト ClustalW        http://clustalw.genome.jp/
   2)配列 (Fata format) をペーストして execute multiple alignment を押す(各種ボ
       タンはデフォルトで)
           :
         練習 上の 6 種類 gnrh のアミノ酸配列をコピーして、       execute multiple alignment
       を押して実行。


           上に Multiple sequence alignments の結果が表示される。
           その下にある select tree menu で表示形式を選択して、Exec をクリックす
           る
             表示形式、N-J tree branch length と Unrooted dendrogram の結果を比
             較してみよう


  このサイトでの検索結果では、Bootstrap value, evolutionary distance の値は表示
  されない。DDBJ の ClustalW を使えば、これら値が求められる。ただし、計算結果は、
  ファイルの形で E-mail で返信されてくる。また図形を表示するために、Tree View と
  言う無料ソフトをダウンロードする必要がある。


                           実習
                    分子系統樹作成:練習
  ショウジョウバエ(Drosophila)の hedgehog タンパク質に対する、アフリカツメガエ
  ル(Xenopus)とマウスの類似遺伝子を検索して分子系統樹を作成する。


  手順は以下のように行う。
   1. ショウジョウバエ                 の
                   (Drosophila) hedgehog タンパク質のアミノ酸配列を、protein
   データベースからキーワード検索する。アミノ酸配列をコピーする。名前を付けて、
   Fasta format とする。スペースと数字は、そのままにしておいてよい。検索時に排除
   されて、計算される。


   2. Hedgehog のアミノ酸配列を使って、         protein blast 検索を行う。今回は、Database
   を Swissprot protein sequences に選択して下さい。


   3.上位にランクされた配列から、マウスの SHH, DHH, IHH の配列を取り出し、Fasta
   format とする。Xenopus の SHH, DHH1, IHH の配列を取り出し、Fasta format とする。
   スペースと数字は、そのままにしておいてよい。
                                   24
      4.ClustalW(http://clustalw.genome.jp/)を使って、マルチプルアライメントを
      行う。マウスと Xenopus の間で配列の保存性を注意深くみて、保存性の特徴を理解す
      る。


      5.分子系統樹を作成する。N-J tree branch length と Unrooted dendrogram の結
      果を比較


      4の結果とあわせて、Outgroup, Paralog, Ortholog の関係を理解する。ヒト遺伝子
      間のパラログよりも、ヒトと Xenopus のオルソログ間の方が保存性の高いことに注意。
      これは祖先遺伝子が重複して2つの遺伝子(パラログとなる)を形成してから、種分
      化が起こったためである。



練習
ヒトゲノムに Vitamin D 受容体、SHH のパラログ遺伝子がそれぞれ何種類存在するか調べ
  てみよう。


Hedgehog の配列(ショウジョウバエ、マウス、アフリカツメガエル)
>drosophila_hh

MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRARNLYPLVLKQTIPNLSEYTNSASG

PLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDYHHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEAGFDWVSYVSRRH

IYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMTANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLTFVFADRIEEKNQVLVRDV

ETGELRPQRVVKVGSVRSKGVVAPLTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANALYKVKDYVLPQSWRHD

>mouse_dhh

MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGADRLMTERCKERVNALAIAVMNMWPG

VRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSLAVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAADAAGRVVPTPVL

LFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAPVFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLASCYAVLESHQWAHRAFAPL

RLLHALGALLPGGAVQPTGMHWYSRLLYRLAEELMG

>mouse_ishh

MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDRLNSLAISVMN

QWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKSEHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDRVLAMGEDGTPTF

SDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAAHFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVEDVVASCFAAVADHHLAQLA

FWPLRLFPSLAWGSWTPSEGVHWYPQMLYRLGRLLLEESTFHPLGMSGAGS

>mouse_shh

MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDKLNALAISVMNQWPG

VKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFL

TFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPSALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILINRVLASCYAVIEEHSWAH

RAFAPFRLAHALLAALAPARTDGGGGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS

                                                          25
>xenopus_shh

MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGADRLMTQRCKDKLNALAISVMNQWPG

VKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSSDPQGNLLYSDFL

MFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVFASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLASCYAVIEEHTWAHLAFAPL

RFGMSLSSYIYPRDSSPPSGLQPHHQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS

>xenopus_dhh-a

MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADRLMTERCKDRVNALAISVMNMWPGV

KLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLGVRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTDETGQLITSVVLL

FLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYRVQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHVSLAPLRLFQ

GIASMLPDLDMSDGVHWYCHILYVLAKYVLWWDMP

>xenopus_dhh-b

MPAVRILILAACCCWLLLLPVRCCGPGRGPVGGRRRYMRRLVPLLYKQFVPNVPEKTLGASGKSEGKIRRGSERFIKLVPNYNPDIIFKDEENTGADRLMTERCKDRVNALAISVMNMWP

GLKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVNTDNSLGVRSGGCFPGTAMVMMETGKKKPLSELKLGDTVFTTDETGLLIHSVV

LLFLHRDPYKTATFVLIEAEGHPTKLLVTPNHLLFIKSSSSTGFQPTFAYRVQIGDLIQIYVNGTQVQSSKVVRVSVDEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHASLAP

LRLFQGIASMLPDLHTSDGVHWYCHILYVLAKYVLWWDMP

>xenopus_ihh

MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADRLMTQRCKDRLNSLAISVMNQWPGV

KLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAAAKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMDNSGRPTYSDFLS

FLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAVFASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSCFALVQKQRLAQIVYWPLR

VLYNLGIIAGTQPSQQMGIHWYSKALYHLGRLILHGNEFHPLGIVQLES




                                                          26
11 月 29 日(第 9 回)


1.代謝経路データベースの利用
      一般に公開されている代謝経路のデータベースとして最も充実しているのが、京
    都 大 学 化 学 研 究 所 が 統 括 し て い る KEGG (Kyoto Encyclopedia of Genes and
    Genomics)である。代謝経路のマップを調べることができるだけでなく、遺伝子の
    機能、配列、タンパク質の立体構造も検索できる。クローニングした遺伝子がどの
    ような代謝経路に機能しているか、なども調べることができる。またさまざまな医
    薬品(抗生物質等)の構造、薬理作用を検索することもできる。遺伝子や化合物の
     機能や相互作用を調べる場合、またレポート作成等にも役立つ。授業では、KEGG の
     使い方を実習します。


  http://www.genome.jp/kegg/pathway.html
      代謝経路におけるタンパク質間相互作用、代謝経路に介在する酵素、薬剤の構造等
      を調べることができる。


  KEGG Pathway を開ける。パスウェーの項目は、以下ように分類されている。
    1. Metabolism;代謝経路(ビタミン A, retinol metabolism, の代謝経路を調べてみ
      よう。   代謝産物を示す◯がアクティブで構造等が表示される。              また代謝を司る酵素
      名もアクティブで、配列情報等が表示される)
   2. Genetic Information Processing;遺伝子から蛋白質合成経路・蛋白の修飾と分
      解・ゲノムの修復等(homologous recombination と non-homologous end-joining
      の経路を比較してみよう)
   3. Environmental Information Processing;細胞内シグナル伝達経路・分泌性シグ
      ナル因子を介した細胞間相互作用(TGF-beta の細胞内伝達系を調べてみよう。発
      現の促進と抑制(アゴニスト)の関係が分かる)
   4. Cellular Processes:細胞の活動、細胞分裂サイクル等(Oocyte meiosis(卵母
      細胞減数分裂)を調べてみう)
   5. Organismal system;免疫系・内分泌制御経路等(GnRH、生殖腺刺激ホルモン放出
      ホルモン、の内分泌経路を調べてみよう)
   6. Human Deseases:発ガン経路・代謝異常等(Melanoma, プリオン病, diabetes(1
      型糖尿病、2 型糖尿病)の発症経路を調べてみよう)
   7. Drug Development:抗生物質・薬剤の化学構造(penicillin, antidepressants を
      調べてみよう。合成経路、薬剤の分解酵素等も表示される)


  遺伝子のキーワードで検索する場合(遺伝子名からパスウェーに入る)
    1.先頭ページで、Enter key words に入力して Go
    2.練習に shh; sonic hedgehog と入力してみよう
    3.shh 遺伝子が関与するパスウェー(Entry)が複数表示される
                                  27
  4.試しに map04340 を選択してみよう。ここでは経路の生物学的役割の概要が表
    示される。パスウェーの図をクリックすると図が拡大される。
  5.各遺伝子がアクティブで、配列・機能情報にリンクしている。試しに Hh を開
    けてみよう
  6.各種生物の Hh メンバーがパラログ毎に表示されている。      試しにヒト HSA の shh
    をクリックしてみよう。Ortholog, Paralog ボタンを押してみよう
  7.Motif ボタンを押してみよう
  8.立体構造も表示されている。立体構造表示ソフトをダウンロードすれば、詳し
    い立体構造を調べることができる。


KEGG の BLAST 検索を使って、調べたい遺伝子・タンパク質が乗っているパスウェーを
検索することもできる.
       1. KEGG2 先頭ページの GENES をクリック。BLAST を開ける。

        2. 例として、下の塩基配列(私達の研究グループがウナギからクローニング
                                   で
           した遺伝子でまだデータベースには登録していない) BLASTX 検索してみ
           よう
>test_DNA_sequence-2
          ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGCCTG

          CTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGACAAGAC

          CTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGGCGTCCATGG

          GAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACTCGTGTGCCTCCA

          AACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAAGGGCTATGTCACAGA

          AGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGAAGACTCAGGGAACACTTG

          TATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTCATGACTCAAGCCTTCCAGTAT

          GTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAGATATGATTCAGAACTCCGTGTTGC

          CAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCACTGTTGGACCAATCTCTGTGGCTATTG

          ATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACCCAAGAAGTAAACCATGGTGTTCTAGCAGTT

          GGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCCTTTTGGGGAACAGGGCTACATTCGCATGGCACG

          AAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGACGACCTGAAGCAAAGGATTGATTTCTAACTTGAAACA

          TTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGAATACTGTTAAAATGATTTGTATTAAAAAAATATATATTT

          TTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA

3.ゼブラフィッシュ Dre のエントリーを開けてみよう
4.Pathway を開けてみよう。検索した遺伝子のパスウェー上の位置が分かる




                                         28
12 月 6 日(第 10 回)
                           講義


                   —   ゲノム解読プロジェクト   ー


 国際研究プロジェクトによるヒトゲノム計画 (Human Genome Project) は 1990 年に着
手され、十数年後の 2003 年に解読完了が宣言されました。ヒトゲノム計画は、階層的シ
ョットガン法と呼ばれる手法で行われました。すなわち連鎖地図の作成から BAC クローン
の整列化の過程を経たのち、染色体上にマップされた BAC クローンをショットガン法で解
読し、染色体レベルにまで塩基配列を繋ぐという過程を経て、ゲノム塩基配列の完全解読
に到達しました。このプロジェクトの間に塩基配列の解析能力(DNA シークエンサー)は
大幅にアップし、同時に塩基配列をつなぎ合わせるコンピューターの処理能力も著しく進
歩したことにより、連鎖地図作製を省略して、全ゲノムをいきなりショットガン法で読む
ことが可能となりました。民間企業のシエラ社は、数年のあいだに全ゲノムショットガン
法でヒトゲノムを解読することに成功しました。最終的には、国際研究プロジェクトとシ
エラ社の解読成果は同時に公表されました。
 ヒトゲノム計画の終了と前後して、多くの生物で全ゲノム解読プロジェクトが始められ、
既に数十種類の動物の全ゲノム配列の解読が終了し、現在も新しい生物のゲノム解読プロ
ジェクトも次々に着手されています。ゲノム情報は、遺伝子の機能解析の有力なツールに
なることは言うまでもありませんが、生物間でゲノム構造を比較することにより、無脊椎
動物から脊椎動物の進化の過程で起こったゲノム構造の変化を知ることも可能になりまし
た。哺乳類の中でも単孔類(カモノハシ)、有袋類(オポッサム)、有胎盤類の進化の過程
や、またチンパンジーとヒトでの知能の差をゲノム構造の進化の観点から議論することも
可能になりました。全ゲノム塩基配列が利用できるという条件のもとで、進められる遺伝
子やゲノム研究はポストゲノム研究とよばれます。既に家畜や野菜や穀物植物のゲノムも
多数解読されています。学部2年生が研究にたずさわるころには、さらに多数の生物のゲ
ノム情報が利用できるはずです。新しい研究分野を開拓するためには、ゲノム情報を有効
に利用できるがどうかが、極めて重要な素養となります。
 授業では、ヒトのゲノムプロジェクトがどのように進められたかを2週にわたって紹介
し、その歴史を理解してもらおうと思います。また各授業の後半ではゲノム情報を利用す
るウェブサイトを実際に利用することにより、この分野の解析がいかに強力なツールにな
るかを体験し、実感してもらおうと考えています。



                          講義内容


  ヒト全ゲノム塩基配列解読の行程(1/2)
       1)連鎖地図
       2)BAC ライブラリー作製
                           29
          3)BAC ライブラリー整列化(物理地図)
          4)ショットガンシークエンス
          5)アセンブル
          6)アノテーション


 *****************************************************************************
 **************
 ゲノム解読プロジェクトで解析されたゲノム DNA 配列情報は、NCBI と Ensembl で統括
 的(解析されたほぼ全ての生物)について、一般に利用できるよう整備されています。
 ゲノム上の遺伝子の位置や類似遺伝子の検索には NCBI が便利です。ゲノムの塩基配列
 をデータベースから取り出す場合には、Ensembl を使います。授業では、NCBI と Ensembl
 の使い方を実習します


                                     実習

                         ゲノムデータベースを利用する


どのような生物でゲノム配列が解析されているか?調べてみよう
 1.NCBI の all resources を開ける
 2.Genome Project を開ける
 3.真核生物について調べよう:NCBI Resources の Eukaryotic Projects(右カラム)
   を開ける
 4.Mammals に絞ってみよう
 5.Status: Complete (解読完了)、Assembly(配列を繋いでいる途中)   、In Progress
   (シークエンス途中)        。
   Methods: Clone-based(階層的ショットガン法)   、WGS(全ゲノムショットガン法
     Whole genome shotgun sequencing)。
     Depth: ゲノムサイズの何倍量のシークエンス情報が得られているか。数値が大き
     いほど正確にアセンブリーされることになる。


                       —NCBI Map Viewer の利用—
 NCBI の Map Viewer ではゲノム解読が行われた生物種ごとに、遺伝子の染色体上の位置
 を調べること、BLAST 検索を行うことができます。授業では、Map Viewer を使って、4
 項目を実習します。


                NCBI Map Viewer の利用(1/4)
               —遺伝子の染色体上の位置を調べるー
     1.NCBI 先頭ページ All resources の Map Viewer を開ける
     2.ゲノム塩基配列が公開されている生物種一覧が表示される
                                     30
   3.調べたい生物の Tools から虫眼鏡マークをクリック
   4.Search for の枠に遺伝子名を記入し、リターンキー(or Find)を押す
   5.遺伝子の位置が染色体上に赤く示される。下の Map element を選択すれば、よ
     り詳細なゲノム情報が表示される。


ヒト染色体における遺伝子の位置(遺伝子座)を検索してみよう
    練習:sonic hedghog (shh)を検索してみよう
      1.NCBI で Map Viewer を開ける
      2.Homo sapiens (human)の Tools から虫眼鏡マークを選択
        3.Search for に shh を記入して、Return
        4.Map element のなかから SHH を選んでクリック
        5.shh の染色体上の位置、周辺の遺伝子が表示される
        6.Zoom out、Zoom in してみよう
        7.SHH をクリックすると、SHH 遺伝子のイントロン・エクソン構造、変
        異による病状等についての情報が得られる
        8. OMIM (OMIM は KEGG にもリンク), HGNC (HUGO nomenclature committee;
        HUG0=human genome organization) を開けると、変異による異常や分子構
        造の特性に関する情報が得られる


     ウシ、ニワトリ、ゼブラフィッシュでも shh でキーワード検索してみよう




                               31
12 月 13 日(第 11 回)


鈴木不在のため酒井先生が代わりに下記の内容で授業を行います。



配列のアラインメント手法とBLAST検索の原理


・配列のアラインメントとは
・全域アラインメントと局所アラインメント
・アミノ酸置換行列
・動的計画法に基づく局所アラインメントの求め方
・BLASTはどのように検索を行っているのか
 (動的計画法との違いと、それにともなう利点、問題点)



進化系統樹とCLASTAL Wで用いられている近隣結合法の原理


・種の進化モデル
・分子時計仮説
・ウルトラメトリック木と加法木
・UPGMA法
・近隣結合法


以上について概説する。


同内容の詳細については3年前期「生物生産情報処理概論」にて講義する。




                    32
12 月 20 日(第 12 回)

                                             授業項目


   1)ヒト全ゲノム塩基配列解読の行程(2/2)
        1)連鎖地図・物理地図(Radiation hybrid panel)
        2)BAC ライブラリー作製
        3)BAC ライブラリーの整列化
        4)ショットガンシークエンス
               5)アセンブル
               7)アノテーション


   2)cDNA 解読、EST 解析プロジェクトについての解説




                            NCBI Map Viewer の利用(2/4)
                          —ゲノムデータベースを使った BLAST 検索—
ゲノム解読が行われている各生物のゲノムデータベースに対して BLAST 検索を行うことが
できます。Database で Genome (all assemblies)を選択すると全ゲノム塩基配列に対して
類似配列を検索できます。Database で RefSeq protein を選択すると、アノテーションで
予測されたタンパク質のアミノ酸配列に対して配列の類似検索を行うことができます。
    練習:ショウジョウバエの eyeless 遺伝子のヒト相同遺伝子を探してみよう
    1.Map Viewer の human のBボタンを選択
    2.eyeless のアミノ酸配列を枠内にコピーする
    3.Database は、Genome (all assemblies)を選択
          4.Program は TBLASTN を選択
          5.Begin search をクリック、ページが変わったら View report をクリック
          6.アミノ酸の保存性を見てみよう
          7.Genome View をクリックすると相同遺伝子の染色体上の位置が表示される


          Database に RefSeq protein を選択して、検索してみよう。


>Drosophila_eyeless
MRNLPCLGTAGGSGLGGIAGKPSPTMEAVEASTASHPHSTSSYFATTYYHLTDDECHSGVNQLGGVFVGGRPLPDSTRQKIVELAHSGARPCDISRILQ

VSNGCVSKILGRYYETGSIRPRAIGGSKPRVATAEVVSKISQYKRECPSIFAWEIRDRLLQENVCTNDNIPSVSSINRVLRNLAAQKEQQSTGSGSSST

SAGNSISAKVSVSIGGNVSNVASGSRGTLSSSTDLMQTATPLNSSESGGASNSGEGSEQEAIYEKLRLLNTQHAAGPGPLEPARAAPLVGQSPNHLGTR

SSHPQLVHGNHQALQQHQQQSWPPRHYSGSWYPTSLSEIPISSAPNIASVTAYASGPSLAHSLSPPNDIESLASIGHQRNCPVATEDIHLKKELDGHQS

DETGSGEGENSNGGASNIGNTEDDQARLILKRKLQRNRTSFTNDQIDSLEKEFERTHYPDVFARERLAGKIGLPEARIQVWFSNRRAKWRREEKLRNQR

                                                 33
RTPNSTGASATSSSTSATASLTDSPNSLSACSSLLSGSAGGPSVSTINGLSSPSTLSTNVNAPTLGAGIDSSESPTPIPHIRPSCTSDNDNGRQSEDCR

RVCSPCPLGVGGHQNTHHIQSNGHAQGHALVPAISPRLNFNSGSFGAMYSNMHHTALSMSDSYGAVTPIPSFNHSAVGPLAPPSPIPQQGDLTPSSLYP

CHMTLRPPPMAPAHHHIVPGDGGRPAGVGLGSGQSANLGASCSGSGYEVLSAYALPPPPMASSSAADSSFSAASSASANVTPHHTIAQESCPSPCSSAS

HFGVAHSSGFSSDPISPAVSSYAHMSYNYASSANTMTPSSASGTSAHVAPGKQQFFASCFYSPWV



次に、Drosophila ゲノムに存在する eyeless のパラログ遺伝子を探してみよう
Rice (Oryza sativa)に関連遺伝子が存在するか調べてみよう



              NCBI Map Viewer の利用(3/4)
             —in silico 遺伝子クローニング—
 脊椎動物のなかで遺伝子の機能解析が最も進んでいるマウスでさえも、機能が分かって
いる遺伝子は全遺伝子(2 万数千個)のうちの 3 分の1程度だと思われます。ゲノムデー
タベースには、塩基配列を基に同定された機能未知の遺伝子も登録されています。機能未
知の遺伝子もゲノムデータベースを使えば、塩基配列とアミノ酸を調べることができます。
 コンピューターを使って遺伝子を見つけだす操作は、in silico クローニングと呼ばれ
ています。例えば、ショウジョウバエの研究で重要な遺伝子(例えば、寿命に関係する遺
伝子など)が新しくみつかった時に、その相同遺伝子をヒト、マウス、ゼブラフィッシュ
のゲノムから探し出すことが可能で、このような操作が in silico クローニングと呼ばれ
ます。またゲノムに存在する相同遺伝子を全部リストアップすることも可能です。     今回は、
マウスゲノムに存在する核レセプターファミリーのメンバーを探す操作を実習します。


    練習:マウスゲノムに核受容体ファミリーのメンバーが幾つ存在するか?
          1.NCBI で Map Viewer を開ける
          2.Mus musculus の Tools から B を選択
          3.mouse_vitamin_D_receptor の配列を枠にコピーし、Program を TBLASTN
                  に選択し、Begin Search をクリック
                  4.マウスゲノムに存在する核レセプターファミリーの全てのメンバーが
                  検索されてくる。60 種類あまり存在することが分かる
                  5.上の方にある Genome View をクリックしてみよう:検索されてきた遺
                  伝子の染色体上の位置が表示される

                >mouse_vitamin_D_receptor
                MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKR

                CVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSY

                SPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDL

                TSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAIC

                IVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLE

                VFGNEIS

                                                 34
           練習:では、ショウジョウバエのゲノムには、核受容体ファミリーのメンバーが
           幾つ存在するでしょうか?
           ホヤ(Ciona intestinalis)で検索してみよう


                               NCBI Map Viewer の利用(4/4)
                            —さまざまな生物のゲノムデータベースの利用—


   NCBI, Map Viewer では、バクテリアから植物、哺乳類に至るまで多様な生物のゲノム情
報が利用できます。ヒトが持っている遺伝子の相同遺伝子を進化的にたどって、どの生物
にまで存在しているかと言う疑問についても、BLAST 検索によってたどることができます。


練習:ヒトの増殖細胞核抗原(PCNA: proliferating nuclear antigen)の相同遺伝子を
イネゲノム(Oryza sativa (japonica cultivar-group))、バクテリアから探してみよ
う。またマウスビタミンD受容体の相同遺伝子が、ホヤ、ショウジョウバエ、原生動物(ア
メーバー)、イネに存在するかどうかも試してみよう。


バクテリアのゲノム検索では、small genome に入り、種を指定し、検索する。


>human_pcna
MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNEDIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMD

LDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFSASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYK

IADMGHLKYNLAPKIEDEEGS



>mouse_vitamin_D_receptor
   MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITK
   DNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHK
   TYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTL
   DLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQ
   DYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTL
   QTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS




                                                          35
1 月 10 日(第 13 回)
                     講義

ポストゲノム研究(1)—比較ゲノム:進化に伴うゲノム構造の変化

   進化的に隔たった多様な生物でゲノム解読が行われたことにより、生物間で遺伝子種
  を比較したり、遺伝子ファミリーのメンバーの個数を比較することが可能になりました。
  また染色体上の遺伝子の配列を系統的に離れた生物間で比較することにより、それらの
  共通祖先生物の染色体構造を推定することが可能となっています。比較ゲノムは、この
  ように生物間でゲノムを比較して、進化を論じる研究分野です。授業では、幾つかの事
  例を紹介します。


   フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。脊椎動物
  は、大部分の魚類を含む条鰭類、それとシーラカンス・肺魚および四肢動物を含む総鰭
  類の2つのグループに大別されます。条鰭類と総鰭類は4億5千年前に分岐しました。
  フグとヒトのゲノム構造を比較することにより、4億 5 千年前に生きていた総鰭類と条
  鰭類の共通祖先のゲノム構造が明らかとなり、その後のゲノム構造の変化が解明されま
  した。解析の結果、脊椎動物のゲノムの進化について、次のような予想もされていなか
  った結果が得られました。
  (1)4億 5 千年前に生きていた総鰭類と条鰭類の共通祖先は12組の染色体を持っ
     ていた。
  (2)総鰭類では条鰭類と分かれた直後に、  ゲノムに大量のレトロウィルスが挿入され、
     ゲノムサイズが大きくなった。その後染色体間の転移と融合(ミキシング)が頻
     繁に起こった。
  (3)条鰭類では総鰭類と分かれた直後に、ゲノムの倍化(脊椎動物の誕生から数える
     と3度目) が起こった。重複した遺伝子の大部分は片方がゲノムから脱落したが、
     約 20%の遺伝子は倍加したまま現在でも機能遺伝子として働いている。そのた
      め、ゲノム上の遺伝子数は条鰭類の方が総鰭類よりも 20%程多い。このような
      遺伝子数の増加が、魚類に形態や環境適応の多様性をもたらしたのではないかと
      考えられている。また条鰭類では染色体へのレトロウィルスの挿入はわずかであ
      り、染色体のミキシングもわずかである。


   また、無脊椎動物でも進化的に重要な位置にあるホヤやナメクジウオのゲノム解読が
  行われ、哺乳類でも多数の生物のゲノムが解読されています。生物間でゲノムを比較す
  ることにより、臭覚受容遺伝子が無脊椎動物から脊椎動物の進化の過程で遺伝子数を増
  加してきたことが、明らかになっています。また胎盤の進化では、レトロトランスポゾ
  ン由来の遺伝子が重要な役割を果たしているという、意外な事実も示唆されています。
  またヒトとチンパンジーでは、塩基の置換率はたった 1.23%ですが、反復配列の挿入
  がヒトの方がかなり多いことが分かりました。このように挿入配列は、以前考えられて
  いたようなたんなるガラクタではないことが分かってきました。
                     36
                            実習
        発現データベースを使ったシミュレーション実験(1)
             - digital differential display -
 ゲノム解読プロジェクトの進められている生物では、              EST (expressed sequence tags) の
塩基配列解読プロジェクトも並行して進められています。EST プロジェクトでは、組織あ
るいは細胞種ごとに、cDNA ライブラリーから無作為にクローンを選んで配列(5’, 3’末端
のワンパスシークエンス)を解析しています。EST データベースでは、同定された遺伝子
種とその数値(何個検出されたか)が組織あるいは細胞種ごとに整理されています。従っ
てデータには、各組織に発現している遺伝子種と遺伝子ごとの相対的な発現強度が反映さ
れていることになります。  これらのデータは、         トランスクリプトーム (Transcriptome) と
呼ばれます。このデータを利用することにより、調べたい組織に発現している遺伝子の種
類と発現強度、組織間で発現強度の異なる遺伝子を調べることができます。コンピュータ
ーで遺伝子発現を調べる操作は、digital differential display と呼ばれます。授業では
次の例題を使って、digital differential display の操作を実習します。


例題1.生物の各器官で発現する遺伝子の種類と発現強度を調べる
 ウシの乳腺で発現する遺伝子種とその強度は?


例題2.2つの細胞種で発現量が異なる遺伝子を調べる
 マウスの ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量の異なる
 遺伝子は?


例題3.ある生物の2つの器官で発現量が異なる遺伝子を調べる
 マウスの小脳 (Cerebellum) と大脳皮質 (Cortex) で発現量の異なる遺伝子は?



               Digital differential display (DDD)のページの開け方
NCBI の Transcriptome 情報を使う - Digital differential display
   1.NCBI の先頭ページにある All Resources から、          Digital differential display (DDD)
      を選択


例題1.生物の各器官で発現する遺伝子の種類と発現強度を調べる
 ウシの乳腺(mammary gland)で発現する遺伝子種とその強度は?
                          手順
  1.Species を Bos taurus に選択、continue をクリック
  2.組織名(Mammary gland)の ID 番号をクリック。発現強度の強い遺伝子から順に表
    記される。TMP は、100 万個の mRNA 当たりに出現する個数を示す。


                                       37
例題2.ある生物の2つの器官・細胞で発現量が異なる遺伝子を調べる
 マウスの ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量の異なる
 遺伝子は?


  1. Species を Mus musculus に選択、continue をクリック
  2. まず A                             の
          (ここでは Embryonic stem cells) ID 番号(15703, 15704, 15705)を選択、
    上の枠内に名前(ES cells)と記入し、continue を押す
  3. B の組織(ここでは Blastocytes)の ID(850, 875, 1021, 10026)をチェックし、
    枠内に名前(Blastocytes)と記入し、continue を押す
  4. A と B で発現強度が有意に異なる遺伝子が、表示される




                                 38
1 月 17 日(第 14 回)最終回


               ポストゲノム研究(2)
         —ゲノムに存在する全ての遺伝子の機能を調べる
  全ゲノム塩基配列の解読のあとにくる最も重要な研究課題として、ゲノムに存在する
 全ての遺伝子の機能解明があげられます。遺伝子の生体内での機能を解明するための最
 も直接的な方法として、遺伝子の機能破壊実験があります。遺伝子ノックダウンあるい
 は遺伝子ノックアウトにより遺伝子の機能を破壊し、発生や器官形成、代謝、行動に表
 れる表現型を解析する訳です。マウス、ゼブラフィッシュ、ショウジョウバエ、線虫は
 ポストゲノム研究のモデル生物に用いられています。これらの生物ではいずれも、遺伝
 子破壊による全遺伝子の機能解明プロジェクトが進められています。線虫と魚類は、ア
 ンチセンス技術を個体レベルで適応できる点で、遺伝子機能解析に圧倒的に有利です。
 特に線虫は、RNAi 法で簡単に遺伝子機能を破壊できることから、ゴール(全遺伝子の
 機能解明)に最も近いと言えます。線虫では機能破壊により寿命が延びると言うような
 興味深い遺伝子も見つかっています。


  脊椎動物の中ではゼブラフィッシュが、モルフォリノオリゴを使ったアンチセンス技
 術で遺伝子機能を破壊できる点で、遺伝子機能の解析が容易だと言えます。具体的には、
 顕微注入によりアンチセンスモルフォリノオリゴを受精卵に注入し、  発生で現れる表現
 型(体に表れる異常)を調べることで、遺伝子機能を解析することが可能です。ただし
 この方法で解析できるのは、受精後 2 日以内に働く遺伝子に限られ、成人病に関連した
 遺伝子等の機能は解析不能です。ゼブラフィッシュのウェブサイト(ZFIN)では、誰に
 でも機能破壊実験を行うことができるように、  各遺伝子の機能破壊に必要なモルフォリ
 ノオリゴの塩基配列が掲載されています。


                      ポストゲノム研究(3)

                      —機能ゲノム学—


                       機能ゲノムの一例

         -   ゲノムを比較して遺伝子の発現調節機構を探る         -
 ポストゲノム研究の重要なテーマとして、全ての遺伝子の機能を調べることに加えて、
遺伝子の転写調節に重要な配列領域を見つけることがあります。転写調節領域は遺伝子が
何時、何処で、どれだけ発現されるかと言う情報をコードしていることから、生物の形態
や環境適応の多様性の背景にあるゲノム情報は、タンパク質コード領域よりもむしろ転写
調節領域に存在する場合が多いものと予想できます。
 特に胚発生など生物の基本的な生命現象に関係する遺伝子(例えば sonic hedghog や Pax
遺伝子)の転写調節領域は、生物間で強く保存される傾向にあります。ゲノム情報を利用
                           39
することにより、遺伝子発現に必須の領域を検索したり、生物間で変異が起こっている領
域を見つけだし、それらの機能や生物学的意味を解析する研究分野は、機能ゲノム学と呼
ばれます。授業では、ヒトとフグの非コード領域の比較から、遺伝子の転写調節に重要な
領域(CNE; conserved non-coding elements)を見つけだした研究事例を紹介します。


                           実習

          —ゲノム塩基配列をデータベースから取り出す—
 これまでにゲノムデータベースを使った BLAST 検索を実習しましたが、Ensembl(ゲノム
データの統括サイト)を使うと、   領域を指定してゲノム配列情報をデータベースから取り出
すことが可能です。ノックアウトマウスの相同組換えに用いる配列、GFP を使ったレポー
ター遺伝子作製用のプロモーター配列等を調べる場合に、    Ensembl で配列を取り出します。
実習では、Ensembl の説明と実際の配列の取り出し方を教えます。

使用法1)Ensembl を使って、試しにマウスの sonic       hedgehog のゲノム配列を取り出し
てみます。


1.下記のウェブサイトを開ける(Sanger 研究所・EBI が管理)
   http://www.ensembl.org/index.html
2.生物種を指定する
   マウスを選択
3.遺伝子名(shh)をボックスに入れて、検索
4.リストアップされてきた遺伝子 ID をクリック(ESMSUSG000000002633)する
   染色体上の地図が表示される
5.左側のツールボックスの中から Sequence を選択してクリック
6.配列が表示される(エクソンは赤、その上流はプロモーター領域の一部)


7.戻って、Location からもゲノム構造を検索することができる
8.Export data で、範囲を選択して配列を取り出すことができる(より長いプロモータ
  ー配列を取りですことができる)
9.シンテニーを調べてみよう
                  :2
   シンテニー(Synteny) つのゲノムの間で、少なくともいくつかの遺伝子に関して
   地図上の位置が類似している状態。共通祖先のゲノムの状態を反映していることに
   なる。


使用法 2)Ensembl を使って、染色体の特定領域の配列を取り出す。


1.Location の右にある Chromosome をクリックする
                            40
2.Location の右にあるボックスに、染色体番号と塩基番号を入力して GO :
   試しに 10 番染色体、10,000,000-10,005,000 b で検索してみよう
3.左の列から、Export data を選択。オプションはデフォルトのままにして、Text を選
  択すると、指定した領域の塩基配列が得られる。


                   講義
               遺伝子の発現調節機構
 遺伝子は、特定の細胞また時期に発現するように調節されています。例えば、ペプシノ
ーゲンの発現は胃に限定されており、筋肉や脳では決して発現しないように制御されてい
ます。発生に関係する遺伝子のなかには、魚類の孵化酵素のように一生のうち孵化時に一
度だけ発現する遺伝子もあります。このような発現調節に関する情報は、ゲノムのコード
領域ではなく、その近辺に存在する転写調節領域にコードされています(5’上流にある場
合が多いが、3’下流にあるものやイントロンにある遺伝子も存在する)  。具体的には、転
写因子が結合するコンセンサス結合配列がその情報と言うことになります。転写因子は、
ゲノムの決まった配列を認識して結合します。その配列がコンセンサス結合配列です。コ
ンセンサス結合配列は、6-20 塩基ほどの短い配列です。転写調節領域には、複数個のコン
センサス配列が存在し、複数の転写因子が結合・解離することにより、遺伝子の転写を精
密に調節しています。講義では転写調節のメカニズムについて解説し、実習で転写調節領
域のコンセンサス配列を検索します。


          -転写調節領域のコンセンサス結合配列の予測-
ゼブラフィッシュの sonic hedghog 遺伝子の 5’上流域の転写調節領域の配列をゲノムデベ
ースから取り出し、コンセンサス結合配列を予測してみます。
 コンセンサス結合配列の検索には幾つかのプログラムがありますが、          実習では TFSearch
 を用います。


 http://www.cbrc.jp/research/db/TFSEARCHJ.html


 他のコンセンサス配列予測プログラム
 http://motif.genome.jp/



問題:ゼブラフィッシュの sonic hedghog(shh)遺伝子の転写調節領域の配列をゲノムデ
ータベースから取り出し、コンセンサス結合配列を予測する。
 (1)最初にゼブラフィッシュの sonic hedghog 遺伝子の 5’上流域の転写調節領域の配
 列をゲノムデベースから取り出します。
 1) Emsembl (http://www.ensembl.org/index.html)を開けます
 2) 対象性物から zebrafish を選択
 3) shh で検索
                                     41
 4) 検索結果のページにある shh のアクセッションをクリック
 5) 左側ボタンの Sequence をクリックすると、ゲノム配列が表示される
 6) 第1エクソン(赤字)から上流の配列(転写調節領域)をワードにコピーする


 (2)次に、MOTIF Search を開ける
      (http://www.cbrc.jp/research/db/TFSEARCHJ.html)
 7) 上の枠に任意の名前を入力する
 8) 下の枠に塩基配列をコピー、分類を脊椎動物とし、Exec をクリック


注意:コンセンサス配列は、ほとんどの場合 6-10b 程の短い配列であり、加えてある程度
の配列のバリエーションを許容します。そのため予想された配列には、実際には転写因子
と相互作用しない配列が高比率で含まれます。検索結果は、目安程度に考えて下さい。実
際のコンセンサス配列を同定するためには、分子生物学の技術を使って実験的に検証する
必要があります。




                             42
  1 月 24 日(第 15 回)

                                           講義



遺伝子の機能解析の手法
   リバースジェネティクス(逆遺伝学:Reverse genetics)
    手法
      遺伝子ノックアウト:マウスでのみ可能
        遺伝子ノックダウン:RNAi(個体レベルでは線虫でのみ可能)
                     モルフォリノオリゴ(ゼブラフィッシュに適応可能)
     フォワードジェネティクス(順遺伝学:Forward genetics)
        ENU (エチルニトロソ尿素) を使った突然変異体ライブラリーの作製と、変異
        体のポジショナルクローニング

ポストゲノム研究のモデル生物たち
    マウス:http://www.informatics.jax.org/
    ゼブラフィッシュ:http://zfin.org/
       ショウジョウバエ:
             http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html
       線虫:http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp
             http://genome.med.yale.edu/lab/index.htm
       酵母:http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932
             http://www.fhcrc.org/science/labs/kruglyak/Data/




                   —ポストゲノム研究(4)—
         ポジショナルクローニングと QTL 解析におけるゲノム情報の利用
                        —講義—
遺伝子の機能解析における、アプローチにはフォワードジェネティクスとリバースジェネ
ティクスの2通りがあることは既に講義しました。フォワードジェネティクスでは、表現
型(phenotype: 形態の異常等)からスタートし、表現型を与えているゲノム配列の変異領
域を連鎖解析によって絞り込み、最終的に点変異やトランスポゾンの挿入等により機能を
喪失している原因遺伝子を特定します。この操作はポジショナルクローニングと呼ばれま
す。
  一方、農業における育種で重要な高成長、耐病性等の性質には、複数の遺伝子が関与し
ていることが普通です。関与する遺伝子を探し出すのは、QTL (量的形質遺伝視座:
quantitative-trait locus)解析と呼ばれ、やはり連鎖解析によって進められます。
  全ゲノムが解読されていれば、連鎖解析に必要な多型性に富むマイクロサテライトもデ
                                           43
ータベースから探し出すことが可能です。また原因遺伝子が存在する領域が連鎖解析によ
り(数百 kb)狭められれば、ゲノムデータベースを使ってその領域に存在する遺伝子を検
索することが可能で、表現型に関係しそうな機能を持った遺伝子に的を絞って、配列の変
化を調べることができます。このようにゲノム解読が行われると、ポジショナルクローニ
ングや QTL 解析が高速化されます。
 授業では、ゼブラフィッシュの突然変異体の作製手順を説明し、変異体バンクのデータ
ベースを使ってみます。そのあと、ポジショナルクローニングについて説明します。


ゼブラフィッシュのデータベース(ZFIN)
http://zfin.org/cgi-bin/webdriver?MIval=aa-ZDB_home.apg



                         —講義—
                    —ゲノムデータベースの利用—
               組織特異的に発光するトランスジェニック動物の作製


緑色蛍光タンパク質(GFP)は、オワンクラゲ由来の発光タンパク質で、480nm の励起光で
照らすと、520nm の強い蛍光を発します。GFP 遺伝子とトランスジェニック技術を組合わす
ことにより、特定の細胞だけを蛍光発光させ、蛍光顕微鏡で生きた固体の中で細胞の挙動
を観察することが可能です。授業では、GFP をレポーターに用いたトランスジェニックフ
ィッシュの作製手順を説明します。組織特異的に働くプロモーター領域のゲノムデータベ
ースからの取り出し方を実習します。そして、遺伝子工学を使ったその領域のクローニン
グと GFP 遺伝子との接続の仕方を講義します。また実際に GFP で発光するゼブラフィシュ
のムービーをウェブサイトで見てみます。



GFP で発光するゼブラフィッシュのムービー
http://www.fishforscience.com/



                         練習
oct4 のプロモーターの制御下で GPF が発光するトランスジェニックフィッシュを作製すれ
ば、細胞が万能性を持っている時に細胞が発光することが期待でき、iPS 細胞の作製に有
効に利用できると考えられます。トランスジェニックフィッシュ作製のためのプロモータ
ー配列を設計してみましょう。


1.トラフグのゲノムデータベースから、  ゼブラフィシュの oct4 配列を使って相同遺伝子
  を検索します。
2.oct4 のプロモーターの配列をゲノムデータベースから取り出します。
                                       44
3.コンセンサス配列を検索し、TATA box, oct 結合配列を検索します。
4.ゲノムからプロモーターを増幅するための PCR プライマーを設計します。


トラフグのゲノムデータベース
http://genome.jgi-psf.org/cgi-bin/runAlignment?db=Takru4&advanced=1


>zebrafish_oct4
MTERAQSPTAADCRPYEVNRAMYPQAAGLDGLGGASLQFAHGMLQDPSLIFNKAHFNGITPATAQTFFPFSGDFKTNDLQGGDFTQPKHWYPFAAPEFTGQVAGATAATQPANISPPIGE

TREQIKMPSEVKTEKDVEEYGNEENKPPSQYHLTAGTSSVPTGVNYYTPWNPNFWPGLSQITAQANISQAPPTPSASSPSLSPSPPGNGFGSPGFFSGGTAQNIPSAQAQSAPRSSGSSS

GGCSDSEEEETLTTEDLEQFAKELKHKRITLGFTQADVGLALGNLYGKMFSQTTICRFEALQLSFKNMCKLKPLLQRWLNEAENSENPQDMYKIERVFVDTRKRKRRTSLEGTVRSALES

YFVKCPKPNTLEITHISDDLGLERDVVRVWFCNRRQKGKRLALPFDDECVEAQYYEQSPPPPPHMGGTVLPGQGYPGPAHPGGAPALYMPSLHRPDVFKNGLHPGLVGHLTS




                                            —ポストゲノム研究—

 ポストゲノム研究の一つに、染色体上の遺伝子の配置を生物間で比較解析する研究分野
があります。染色体上で遺伝子の並びが一致している状態は、シンテニーと呼ばれます。
ヒトとマウスを比べると、四肢動物では染色体の組み替えと再配置が頻繁に起こっている
ため、染色体レベルで見ると小さな断片でシンテニーが保存されていることになります。
 一方、魚類では四肢動物と分かれてから直後に全ゲノムの重複が起こっているため、魚
類の染色体はヒトやマウスの染色体に対して2重のシンテニーを示す特徴があります。


                   実習
                —シンテニー解析—
(1)ヒトとマウスゲノムのシンテニーの比較
NCBI
All database
HomoloGene
Genome Resourse---human
Homology Map


(2)LEFTY と言う一つの遺伝子の周辺のシンテニーの比較
LEFTY(胚の左側に発現して、心臓と腸の非対称性を決まった方向に調節する遺伝子)の周
辺に存在する遺伝子をヒトとマウスで比較します。


1.ヒトとマウスの MapViewer で、lefty でキーワード検索します。
2.Lefty 周辺にならんでいる遺伝子種を記録し、ヒトとマウスで比較しましょう。



                                                          45
                                              推薦図書
ゲノム関連
       「ゲノム」岡崎康司/坊農秀雅監訳・メディカル・サイエンス・インターナショナル社(9,500 円)
       「ゲノム研究実験ハンドブック」辻本豪三、田中利男・羊土社(6,500 円)
       「大規模ゲノム解析とポストシークエンス時代の遺伝子機能解析」林崎良英監修・中山書店(3,600 円)
       「比較ゲノムから読み解く生命システム」藤山秋佐夫監修・秀潤社(4,000 円)


バイオインフォマティックス関連
       「バイオインフォマティックス基礎講義-一歩進んだ発想をみがくために」岡崎康司/坊農秀雅 監訳・
           メディカル・サイエンス・インターナショナル社(3,900 円)
       「バイオインフォマティックスがわかる」菅原秀明・羊土社(4,200 円)
       「ゲノム情報はこう活かせ」岡崎康司/坊農秀雅・羊土社(4,410 円)
       「即活用のためのバイオインフォマティックス入門」広川貴次/美宅成樹著・中山書店(3,500 円)
       「バイオデータベースとウェブツールの手とり足とり活用法」中村保一ら編集・羊土社(3,800 円)
       「できるバイオインフォマティックス」広川貴次/美宅成樹著・中山書店(3,500 円)
      「バイオインフォマティックス」メディカル・サイエンス・インターナショナル社(9,500 円)
      「バイオリソース&データベース活用術」秀潤社(4,600 円)
      「バイオインフォマティクス事典」日本バイオインフォマティクス学会編集・共立出版(14,000 円)




                                           ウェブサイト

研究室 home page              http://www.agri.tohoku.ac.jp/bioinfor/index-j.html
===========================================================================
                 文献検索、塩基配列、ホモロジー検索、ORF finder、Map viewer 等
NCBI                                   http://www.ncbi.nlm.nih.gov/
(National Center for Biotechnology Information)


                  塩基配列、ホモロジー検索、分子系統樹作成、シークエンス登録等
DDBJ                                  http://www.ddbj.nig.ac.jp/Welcome-j.html
(DNA Data Bank of Japan)


           塩基配列、ホモロジー検索、タンパク質の構造(ドメイン・モチーフ検索等)解析
EBI                                    http://www.ebi.ac.uk/Information/
(European Bioinformatics Institute)
=========================================================================
                                           分子系統樹作成
ClustalW                               http://clustalw.genome.jp/
=========================================================================

                                                  46
                                  タンパク質・遺伝子の機能検索
オントロジー                                http://www.geneontology.org/
                                      http://www.pir.uniprot.org/
ドメイン・モチーフ検索                           http://www.ebi.ac.uk/Information/
シグナルペプチドの予測                           http://www.cbs.dtu.dk/services/SignalP/
3D 立体構造の予測、DNA の翻訳                  http://ca.expasy.org/
ノックアウトマウスの表現型                         http://www.informatics.jax.org/
=========================================================================
                                   転写調節領域のモチーフ検索
転写因子の結合部位予測                           http://www.cbrc.jp/research/db/TFSEARCHJ.html
=========================================================================
                                            代謝経路
KEGG                                http://www.genome.jp/kegg/pathway.html
=========================================================================
                                     ゲノム研究のモデル生物


マウス                                           http://www.informatics.jax.org/
ツメガエル                                http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1
ミドリフグフグゲノムデータベース                              http://www.genoscope.cns.fr/externe/tetranew/
トラフグフグゲノムデータベース                               http://fugu.biology.qmul.ac.uk/
トラフグフグゲノムデータベース
                  http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1
ゼブラフィッシュ                                  http://zfin.org/
                         http://www.ensembl.org/Danio_rerio/index.html
メダカ                        http://shigen.lab.nig.ac.jp/medaka/
                    http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.html
ショウジョウバエ                   http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html
                           http://genome.med.yale.edu/lab/index.htm
線虫                         http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp
酵母                         http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932
                         http://www.fhcrc.org/science/labs/kruglyak/Data/
=========================================================================
                                         cDNA, EST 情報
マウス cDNA                  http://fantom3.gsc.riken.jp/index.html
アフリカツメガエル EST              http://xenopus.nibb.ac.jp/
メダカ EST                   http://medaka.lab.nig.ac.jp/est_index.html
カタユウレイボヤ EST               http://ghost.zool.kyoto-u.ac.jp/indexr1.html


=========================================================================

                                               47
                                      microarray に関する情報
ヒト繊維芽細胞                      http://genome-www.stanford.edu/serum/data.html
ショウジョウバエ                     http://genome.med.yale.edu/Lifecycle/


=========================================================================

                                              その他
                                     http://genes.mit.edu/GENSCAN.html
                                     http://www.tigr.org/software/microarray.shtml
                                     http://motif.genome.jp/
                                     http://www.rcsb.org/pdb/
=============================================================




                                                 48

								
To top