BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

谷歌BigQuery增加了新的公开数据集

| 作者 Alex Giamas 关注 9 他的粉丝 ,译者 谢丽 关注 11 他的粉丝 发布于 2017年1月10日. 估计阅读时间: 2 分钟 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。

Stack Overflow近日宣布,通过谷歌BigQuery提供它的数据集。开发人员可以使用平常的SQL语句查询完整的Stack Overflow数据集,包括帖子、投票、标签和徽章。使用BigQuery的REST API,开发人员可以根据需要使用他们自选的工具导出数据。BigQuery上的数据集支持联合查询,开发人员使用普通的SQL就可以跨领域获得有用的见解。

除了Stack Overflow的数据集以外,BigQuery还支持对Hacker News数据集GitHub数据集的访问,这两个数据集连同Stack Overflow数据集可以提供有用的见解。BigQuery近日还围绕纽约市的数据增加了三个数据集,分别是关于机动车碰撞城市自行车旅行及311非紧急市政服务电话请求。BigQuery之前已经有一个数据集,其中包含2009年到2015年纽约市的每一次出租车和豪华轿车旅行,上述三个数据集对此是一个补充。

当前,BigQuery还有其他可用的数据集,其中包括气象信息部分数据远至1763年)、医疗数据、350万数字化图书、一个包含元数据并标注了900万URL的图像数据集、美国国税局及美国职棒大联盟的数据。还有一个数据集包含了世界各地的新闻和事件,每15分钟更新一次。该数据集是由GDELT项目提供的。此外,BigQuery还包含Personal Genome项目提供的Genomics数据集Wikipedia页面访问量数据以及将近20亿条Reddit评论

感兴趣的读者可以通过BigQuery控制台获取Stack Overflow数据集,也可以通过reddit社区参与进一步的讨论。

查看英文原文Google BigQuery Adds New Public Datasets

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT