BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Cloudera宣布与博德研究所合作

| 作者 Dylan Raithel 关注 8 他的粉丝 ,译者 刘嘉洋 关注 0 他的粉丝 发布于 2016年6月16日. 估计阅读时间: 3 分钟 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。

根据Cloudera上月报道,他们将会与博德研究所共同合作研究博德研究所的Genome Analysis Toolkit第四代产品Hellbender(GATK4)。InfoQ之前对其进行过相关报道

Cloudera的生命科学部门负责人Shawn Dolley称GATK4可以节约成本,并减少了研发时间,并同时宣布有关博德研究所与各种云IaaS提供商的广泛合作,但不提供定量的标准。Dooley提到了合作工作所能带来的优势,

2014年Cloudera与Spark之间的合作,推动我们成为首个可以交付、支持并提供Spark培训的Hadoop供应商。我们很荣幸可以将我们的专业知识运用到多omic生物标志分析领域,投资基于Spark的生物信息学标准,并与博德研究所合作创造下一代GATK产品。这种低成本的基因组测序和大数据技术的领先技术相结合,代表着我们可以更广泛地对患者的基因组进行测序,并产生之前从未得到过的数据集。

云平台的用例和架构注重于避免重复的基础设施,并推进最佳实践,使用户可以深入理解观察疾病和治疗方法,而不仅仅是管理基础设施。博德研究所数据科学和数据工程高级总监、GATK软件包创始人Eric Banks博士说,

博德研究所的GATK产品目前有超过31000名注册用户。绝大多数用户建立了本地计算存储基础设施,以处理需要进行基因分析的庞大信息。这些合作将为我们消除传统技术的限制,同时给予相同高质量数据处理水平提供新的机会。

关于GATK之前的版本到GATK4之间性能的提升,Bank表示,

在Cloudera 企业版中使用Spark计算框架,给予了我们在GATK3上因其计算复杂程度无法实现的工具。在Cloudera
企业版上,我们现在可以以快于先前版本的GATK两个数量级的速度来运行基因数据分析,加速反复分析,推进基因创新。

博德研究所与laaS提供商的广泛合作旨在让下一代GATK Spark可以基于SaaS模型使用,让用户可以通过不同的laaS登录GATK4,而不受特定提供商的限制。GATK4最早将在今年发布,根据提供商不同价格也会不同。免费的许可证将会提供给学术研究,而收费的许可证将可以供给商业用户使用。

查看英文原文Cloudera Announces Partnership with the Broad Institute


感谢张龙对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT