BT

InfoQ ホームページ ニュース GoogleのBigQueryに新たなパブリックデータセットが追加

GoogleのBigQueryに新たなパブリックデータセットが追加

ブックマーク

原文(投稿日:2017/01/05)へのリンク

Stack Overflowは、そのデータセットをGoogleのBigQueryを通して利用可能となることを最近発表した。開発者は、標準のSQL文を使用して、投稿、投票、タグ、バッジなどのStack Overflowデータ全体を対象にクエリできる。BigQueryのREST APIから、開発者は、彼らが選択したツールを使用してオンデマンドでデータをエクスポートできる。BigQueryで利用可能なデータセットは、SQLを直接記述してJOINすることができるため、開発者はドメイン間で有用な情報を得ることができる。

Stack Overflowデータセットに加えて、BigQueryではHacker NewsデータセットGitHubのデータセットへのアクセスが可能である。それらが、Stack Overflowのデータセットと併せて提供されることで、有益な情報を得ることができる。また、最近、ニューヨークの情報について3つのデータセットが追加された。自動車の衝突Citiの自転車の走行経路、緊急でない自治体へのサービス要求で311番への電話に関するものである。これらのデータセットは、すでにBigQueryで提供されている2009年から2015年までニューヨークのタクシーやリムジンでの移動経路のデータセットを補完する。

BigQueryのデータセットでは他に、1763年までの日付付き気象情報、Medicareデータ、350万のデジタル化された書籍、900万URLのメタデータとラベル付けされた画像データセット、IRS、メジャーリーグのデータが現在入手可能である。15分ごとに更新される、ワールドワイドのニュースやイベントのデータセットもGDELTプロジェクトを通して利用可能である。また、Personal Genome Projectを通してGenomicsデータセットWikipediaページビューのデータ、約20億のRedditのコメントを入手可能である。

Stack Overflowデータセットは、ここのBigQueryコンソールを介して利用可能である。より詳細な議論はredditコミュニティで参照可能である。

 
 

Rate this Article

Relevance
Style
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

BT

あなたのプロファイルは最新ですか?プロフィールを確認してアップデートしてください。

Eメールを変更すると確認のメールが配信されます。

会社名:
役職:
組織規模:
国:
都道府県:
新しいメールアドレスに確認用のメールを送信します。このポップアップ画面は自動的に閉じられます。