BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース MicrosoftのDNAストレージの近況

MicrosoftのDNAストレージの近況

ブックマーク

原文(投稿日:2016/05/01)へのリンク

ディジタルデータストレージ用の合成(synthetic)DNAの研究を続けるMicrosoftが先日,遺伝学のスタートアップであるTwist Bioscienceから,1,000万鎖のDNAを購入することで合意した。

MicrosoftはWashington大学と共同でDNAストレージの研究をしていることが知られている。この共同研究グループは先日,下記の図のような,DNAベースのアーカイブストレージシステムの全体的なアーキテクチャを解説した論文を発表した。

DNAストレージシステムは,DNAに保存するためにデータをエンコードするDNAシンセサイザ(synthesizer),ボリュームにマップするDNAのプールをストアするコンポーネントを備えたストレージコンテナ,DNAシーケンスを読み取ってディジタルデータを再現するDNAシーケンサ(sequencer)で構成される。

DNAストレージが解決しなければならない,興味深い問題のひとつはアドレッシングだ。DNAストレージの基本ユニットはDNA鎖(strand)で,およそ100~200のヌクレオチドからなり,50~100ビットの情報を保持する能力を持つ。これはつまり,一般的なデータオブジェクトをマップするために,非常に多くのDNA鎖が必要であるということだ。現在はキー・バリュー・アーキテクチャが使用されている。キーを必要な鎖を含むプールの先頭に関連付けることで,ランダムアクセス機構を使ってプール内の鎖にアクセスすることが可能になる。

もうひとつ興味深い点は,データの表現についてである。DNAは4つの塩基(A, C, G, T)の組み合わせであるため,最も直接的なアプローチは4進数を使用することだ。例えば01110001は4進数では1301となり,DNAシーケンスではCTACで表現できる。しかし現在の研究では,3進数による表現が選択されている。これによってひとつのヌクレオチドを誤り訂正に使用することが可能になる。先程の例であれば,0110001は3進数で01112となり,DNAシーケンスのCTCTGにマッピングされる。

信頼性向上のためのエンコード方式や実験の内容など,DNAストレージの動作に関する詳細は,前述のPDF論文に記載されている。

Twist Bioscienceによれば,DNAベースのアーカイブ技術には,従来のディジタルストレージに対して2つの大きなメリットがある。ひとつは寿命の長さであり,最近の研究によれば,DNAデータストレージは2,000年に及ぶデータ保持が可能だという。もうひとつはデータ密度の高さで,1グラムのDNAで1兆GBのデータが保持可能だ。

Microsoftとワシントン大学の研究者によると,DNAはストレージはフラッシュメモリやハードドライブの代替品として考えるべきものではない。

私たちはDNAストレージを,深い記憶階層の最終レベルのものと考えています。極めて高密度で耐久性を備えたストレージであると同時に,数時間ないし数日というアクセス時間が必要なのです。

DNAの合成と配列という基本アイデアは,恣意的に並列化することも可能なはずだが,それを実現するには,読み書きのために必要な帯域確保を実現しなくてはならない。

MicrosoftのDNAストレージプロジェクトでリーダを務めるDoug Camean氏は,Twist DNAを使用した初期テストが“ディジタルデータを100%コード化し,復号することが可能なことを実証する”ためのものだ,と明言している。製品として実用化するためには,なすべきことが数多く残っているのだ。

 
 

この記事を評価

関連性
形式
 
 

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT