BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Window Azure で動作する NCBI BLAST

Window Azure で動作する NCBI BLAST

ブックマーク

原文(投稿日:2010/12/02)へのリンク

NCBI BLAST はフルネームを “Basic Local Alignment Search Tool” という。米国保健社会福祉省 (the United States Department of Health and Human Services) の一部門である,国立生物工学情報センタ(National Center for Biotechnology Information) に勤務する研究者グループの開発によるものだ。NCBI では次のように説明している。"BLAST は,配列間の局所的類似性の領域を検出するツールです。このプログラムは,ヌクレオチドあるいはタンパク質の配列をシーケンスデータベースと比較し,両者の統計的有意差を算出します。配列間の機能的ないし進化的関連性の推測に加えて,遺伝子ファミリのメンバ識別に使用することも可能です。"

Microsoft は 11月16日,NCBI BLAST が Windows Azure 上で利用可能 になったと発表した。デモには,既知のタンパク質配列の相互関係を調査する,シアトル小児病院のプロジェクトに関するものも含まれていた。1台のコンピュータでは6年を要するこの分析を,Window Azure 上の NCBI BLAST はわずか1週間で計算を終了した,と同社は主張している。("1台のコンピュータ" の仕様が不明である点には注意が必要だ。1台のスーパーコンピュータが,1台のノートパソコンより高速なのは明らかである。) また別のデモでは,ワシントン大学でのバクテリアによる水素生成の分析を実行している。Microsoft によると,"Harwood 研究室のローカルリソースではその計算処理を扱えなかったので,研究者たちは全国規模のコンピュータクラスタに処理要求を送信しなければなりませんでした。しかし2日後,ジョブキューイング時間の超過のために要求が拒否されてしまったのです。" その処理をすべて Windows Azure で実行するのにわずか3日しか要しなかった,と同社は続けている。

Windows Azure 上では BlastP,BlastN,BlastX という3つの異なるバージョンの BLAST が実行可能だ。BlastP は,タンパク質データベースを対象として類似配列を検索するために使用される。BlastN は同じ処理を DNA 配列で行う。そして BlastX は,タンパク質データベースと DNA 配列のコンセプト翻訳 (conceptual translation) との比較に用いるものだ。3つのアプリケーションはともに,Windows Azure 上で変更することなく実行可能である。なお Web ロールはユーザインターフェースに専念しなければならず,ワーカロールが BLAST アプリケーションのインスタンス個々に対する処理の分配を行う。

Windows Azure 上の NCBI BLAST は,多数の研究者に対して,Microsoft の "Global Cloud Research Engagement Initiative" を通じて無償で提供される。また同プログラムは,"Azure Research Engagement Project" という名称でも知られている。

この記事に星をつける

おすすめ度
スタイル

BT