BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Flickr公布百万图像供研究者使用

| 作者 张天雷 关注 4 他的粉丝 发布于 2014年7月11日. 估计阅读时间: 3 分钟 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!

近日,雅虎洛杉矶研究院的人机交互研究员David Ayman Shamma在雅虎研究院网站新闻上发布了Flickr图片数据集,内有百万张基于Creative Common许可的图片,以供研究者使用。David是雅虎人机交互研究组的高级经理和组长,同时也是雅虎研究院在Flickr的科研联络人。

在官网上对于数据集进行描述和结识的文章中,David表示,信息时代的摄影在不停的发生变化,从古老的C-41逐步演变成为完全不同的形式。粗略估计当前全世界的照片中,有10%的来自过去一年,这还是三年之前给出的估计。图片服务网站Flickr以Creative Common许可为基础,成了人们分享照片的便捷途径。

当前学术界大部分的图像研究,还只能使用小规模数据集进行算法的测试。因此雅虎研究院联手Flickr给全世界的研究人员提供一个更为宏伟的平台。因此Flickr迅速得到了学术界的青睐,每张图片的原始数据,元数据,分享方式、分享网络,都可以为现有的研究问题如计算机视觉、社会网络研究等带来解答,同时也将孕育新的研究萌芽,比如现在机器学习领域的深度学习。

Flickr此次公布的数据集中,包括近1亿张图片和70万部视频,它们全部来自Flickr,并且受Creative Common许可保护。数据集大概有12GB,包括图片id、jpeg格式图片的下载地址,视频的下载地址以及标题、描述、相机类型、标签等元数据。指的一提的是,其中大概5千万图片有地理信息标记,而且关于图片的评论,点赞以及分享数据都可以通过Flickr的API进一步得到。

更令人非常佩服的是,与以往的数据分享机构简单的发布原始数据这种方式不同,雅虎研究院非常认真的要进一步拥抱学术界,David表示,由于1亿张图片的处理需要大量的计算能力和时间,并不是随便一个研究机构都能办到,雅虎研究院联合位于伯克利的国际计算科学研究所(ICSI)以及劳伦斯利弗莫尔国家实验室会基于这些图片和视频提取业界常用的视觉和音频特征,然后放到亚马逊云服务(整个处理过的数据在50TB左右),供全世界的研究人员使用。

此外,David还对研究方向给出了一些建议,如不借助图片的经纬度信息来给出拍摄地点的MediaEval Placing任务,物体定位、概念识别和抽取等任务。

目前数据集的下载需要向雅虎研究院提交申请,审核后可以下载。


感谢郭蕾对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT