BT

GoogleのBigQueryに新たなパブリックデータセットが追加

| 作者: Alex Giamas フォローする 8 人のフォロワー , 翻訳者 編集部T フォローする 0 人のフォロワー 投稿日 2017年1月17日. 推定読書時間: 2 分 |

原文(投稿日:2017/01/05)へのリンク

Stack Overflowは、そのデータセットをGoogleのBigQueryを通して利用可能となることを最近発表した。開発者は、標準のSQL文を使用して、投稿、投票、タグ、バッジなどのStack Overflowデータ全体を対象にクエリできる。BigQueryのREST APIから、開発者は、彼らが選択したツールを使用してオンデマンドでデータをエクスポートできる。BigQueryで利用可能なデータセットは、SQLを直接記述してJOINすることができるため、開発者はドメイン間で有用な情報を得ることができる。

Stack Overflowデータセットに加えて、BigQueryではHacker NewsデータセットGitHubのデータセットへのアクセスが可能である。それらが、Stack Overflowのデータセットと併せて提供されることで、有益な情報を得ることができる。また、最近、ニューヨークの情報について3つのデータセットが追加された。自動車の衝突Citiの自転車の走行経路、緊急でない自治体へのサービス要求で311番への電話に関するものである。これらのデータセットは、すでにBigQueryで提供されている2009年から2015年までニューヨークのタクシーやリムジンでの移動経路のデータセットを補完する。

BigQueryのデータセットでは他に、1763年までの日付付き気象情報、Medicareデータ、350万のデジタル化された書籍、900万URLのメタデータとラベル付けされた画像データセット、IRS、メジャーリーグのデータが現在入手可能である。15分ごとに更新される、ワールドワイドのニュースやイベントのデータセットもGDELTプロジェクトを通して利用可能である。また、Personal Genome Projectを通してGenomicsデータセットWikipediaページビューのデータ、約20億のRedditのコメントを入手可能である。

Stack Overflowデータセットは、ここのBigQueryコンソールを介して利用可能である。より詳細な議論はredditコミュニティで参照可能である。

 
 

Rate this Article

Relevance
Style
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション

InfoQにログインし新機能を利用する


パスワードを忘れた方はこちらへ

Follow

お気に入りのトピックや著者をフォローする

業界やサイト内で一番重要な見出しを閲覧する

Like

より多いシグナル、より少ないノイズ

お気に入りのトピックと著者を選択して自分のフィードを作る

Notifications

最新情報をすぐ手に入れるようにしよう

通知設定をして、お気に入りコンテンツを見逃さないようにしよう!

BT