top
research
UBQ班
IUI班
Bio班
member
link
contact
 
 
about
 
 
Bio班

Bio班では、バイオインフォマティクス(Bioinformatics)と呼ばれる分野を研究しています。バイオインフォマティクスは、BiologyとInformaticsから作られた言葉で、生物と情報科学の両分野にまたがる領域を研究対象としています。例えば、遺伝子に関する莫大な量の時系列データをデータマイニング等の情報科学的な解析をして生物学的な機能を推定することや、複雑な構造をとるタンパク質の立体構造を1次元的な文字列の並びから予測を行うことなどが研究対象として挙げられます。ここで、タンパク質の立体構造予測について少し紹介したいと思います。

アルコールデヒドロゲナーゼ2模式図 左の図は、アルコールデヒドロゲナーゼ2というアルコールを分解するタンパク質の模式図です(図をクリックすると拡大されます)。このタンパク質は2つの鎖からなり、両方の鎖とも同じ立体構造を取っています。それぞれの鎖は、374個のアミノ酸が直鎖状に繋がっています。これらの鎖は文字列の並びとして表現する事ができます(ここをクリックするとこのタンパク質のアミノ酸配列を表示します)。
配列を実験的に決定することは簡単ですが、立体構造を解明することは、多くの場合、容易なことではありません。その上、タンパク質のアミノ酸配列数と既知の立体構造数との間には大きなギャップが存在します。2007年4月2日現在、タンパク質アミノ酸配列数は4,762,006であるのに対し、既知の立体構造数は42,474と100倍以上の開きがあり、この差は今後も開いて行きます。そのため、立体構造がわからないタンパク質のアミノ酸配列に対し、立体構造を計算機上で予測する手法が非常に重要な技術となっています。

立体構造予測の例でも述べたように、あくまでも対象は生物ですが、計算機を用いることで実験を行うのに必要な費用や時間、人手にかかるコストを抑えることができます。また、シミュレーションを行うことで実験的に観測・調査することが非常に難しい現象に関する知見を得ることも可能となってきます。バイオインフォマティクスでは、これまでに開発されてきた様々な情報科学的手法を駆使して生物学的解析を行うことも多いですが、生物学的データ解析のために新しい手法を考えださなくてはならないこともあります。

Bio班の学生は、お台場の近くにある産業技術総合研究所の生命情報科学研究センター(CBRC)内にあるITバイオ研究所にブースを持ち、そこでCBRCの研究員の方々から指導を受けながら研究を行っています。現在取り組んでいる研究テーマとしては、生物配列の比較アルゴリズムの開発や、タンパク質立体構造の基本単位であるドメインを配列から予測する手法の開発などが挙げられます(ここをクリックするとアルコールデヒドロゲナーゼの「親戚」であるタンパク質アミノ酸配列を集めて比較した結果が表示されます)。これらの研究テーマでは、組合せ最適化問題に良く用いられる動的計画法を生物学のデータに対応できるように改良したり、機械学習法であるサポートベクターマシンなどのカーネル法を用いたりしています。なお、下でも挙げている研究テーマしか研究できないということはなく、他にやりたいテーマがあれば、そのテーマの研究を行うことができます。

バイオインフォマティクスでは、純粋な情報科学として見ても困難な問題を扱っており、乗り越えるべきハードルは高いですが、それだけやりがいもあります。Bio班では、実際のデータを用いてクラスターコンピュータを用いた大規模なデータ解析を行いたい人、純粋な情報科学だけではない境界領域の研究を行いたい人に来てもらいたいと考えています。最後に注意点を述べますと、バイオ系の重要な論文は基本的に英語ですので、英語に拒否反応を示さないことが必須となります。また、生物に興味が持てることもお忘れなく。



[現在の研究テーマ]
  • DNA塩基配列やタンパク質アミノ酸配列に対するマルチプルアラインメントアルゴリズムの改良
  • タンパク質立体構造情報に基づくマルチプルアラインメント中の保存領域の同定
  • 配列プロファイルを用いたタンパク質ドメインリンカー予測
  • タンパク質のディスオーダー予測

[過去の研究テーマ]
  • タンパク質におけるRigid domainの同定
  • 相同性検索の精度向上
  • 連鎖解析アルゴリズムの並列化
  • 生物学データベースの統合
  • タンパク質の部分立体構造予測


[2007年度発表実績]
  • Shinsuke Yamada, Osamu Gotoh, Hayato Yamana:PRIME: multiple sequence alignment program based on group-to-group sequence alignment algorithm with piecewise linear gap cost, ISMB/ECCB2007, Austria Center Vienna(2007.7.21-25)
  • 山田真介、山名早人、野口保, "タンパク質立体構造に基づいたアラインメント中の保存領域抽出手法の改良", 第7回日本蛋白質科学会年会, 3P-051 (2007.5.24-26)