BT

最新技術を追い求めるデベロッパのための情報コミュニティ

English edition
Chinese edition
Japanese edition
French edition

ここに入力

Register Sign in

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

ログインして、InfoQのすべての体験をアンロックしましょう！お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。

または

アカウントをお持ちでない方

登録

あなたにとって重要なトピックや同僚の最新情報を入手しましょう最新の洞察とトレンドに関する最新情報を即座に受け取りましょう。
継続的な学習のために、無料のリソースに手軽にアクセスしましょうミニブック、トランスクリプト付き動画、およびトレーニング教材。
記事を保存して、いつでも読むことができます記事をブックマークして、準備ができたらいつでも読めます。

Logo - Back to homepage

ニュースアーティクルプレゼンテーションポッドキャスト Eブック

Topics

デベロップメント

Java
Clojure
Scala
.Net
モバイル
Android
IoT
HTML5
JavaScript
Functional Programming

注目のデベロップメント

Spring BootによるAPIバックエンド構築実践ガイド第2版

何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

のすべてを見る development

設計/アーキテクチャ

Architecture
エンタープライズアーキテクチャ
パフォーマンス&スケーラビリティ
Design
デザインパターン
セキュリティ

注目の設計/アーキテクチャ

アーキテクチュラル・インテリジェンス – 次のAI

アーサー・C・クラーク氏の有名な言葉に、「十分に進歩したテクノロジーは魔法と区別がつかない」と言いました。現在、その「魔法」のような技術がAIとして知られるようになっている。人工知能は素晴らしい包括的な用語であり、マーケティングには最適だが、我々のソフトウェアに単純に追加できる特定のものを意味するものではない。それにもかかわらず、プロダクトオーナーやCEO、マーケティングチームは、あらゆるものに人...

のすべてを見る architecture-design

AIと機械学習、データエンジニアリング

Big Data
データベース

注目の AIと機械学習、データエンジニアリング

AIトレンドがソフトウェアチームに変革をもたらす

クラウドコンピューティングの登場以降、ソフトウェア業界は大きな変革の中にあり、AIの普及でソフトウェア構築・運用・インタラクションが根本的に変わろうとしている。筆者は、SOAからマイクロサービスへの移行、コンテナからサーバーレスへの移行といった近年のIT業界の大きな変化を見届けて発表してきたが、AIはさらなる根本的な変化をもたらそうとしているように感じている。AIの影響は、コーディング作業の自動化...

のすべてを見る ai-ml-data-eng

カルチャー＆手法

Agile
リーダーシップ
Team Collaboration
テスト
UX
Scrum
Lean/Kanban

注目のカルチャー＆手法

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

David Grizzanti氏が、「スタッフ・プラス」への道と、それを「科学」というより「芸術」としてとらえ、芸術を創作することとソフトウェアを創作すること、そして組織のダイナミクスに対処することの類似性について語っている。

のすべてを見る culture-methods

運用/インフラ

Automation
Containers
クラウドコンピューティング

注目の DevOps

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

ここ数年でプラットフォーム・エンジニアリングがホットなトピックになっている。過去10年間にわたり、NetflixやSpotify、Googleがプラットフォームの構築や「ゴールデンパス」の作成、開発者エクスペリエンスの醸成に注力してきたことで先駆者となったが、現在では多くの組織が意図的に組織内開発者プラットフォームを構築し、それに倣おうとしている。スピード、安全性、効率性をもってソフトウェアを提供...

のすべてを見る devops

役に立つリンク集

InfoQについて
InfoQのライター
寄稿
C4Mediaについて
Diversity

地域を選ぶ

En
中文
日本
Fr

AIオールスターズ2025

“AI活用”をキーワードに「AIを使い倒し／使いこなす」企業の最前線をお届けします。

InfoQ Architect Certification

Join Luca Mezzalira for this 5-week online cohort. Master socio-technical architecture leadership.

Register Interest.

QCon London 2026

Learn what works in AI, architecture, data, security & FinTech.

Early Bird ends March 10.

Learn how leading engineering teams run AI in production—reliably, securely, and at scale.

Early Bird ends March 10.

QCon San Francisco

Learn what's next in AI and software, from teams already doing it.

Early Bird ends March 10.

InfoQ ホームページニュース Googleが画像キャプションの機械学習モデルをTensorFlowに移行，オープンソース公開へ

Googleが画像キャプションの機械学習モデルをTensorFlowに移行，オープンソース公開へ

2016年12月6日読了時間 2 分

作者：

Dylan Raithel

翻訳者

吉田英人

ブックマーク

原文(投稿日：2016/10/28)へのリンク

Googleは，TensorFlow画像キャプションモデルのオープンソース化に関する過去数年間の経緯について説明し，既存の実装と新たなアプローチとの精度を比較したテストとパフォーマンスベンチマーク結果を公開した。2014 Inception V1，2015 Inception V2，そして最新のInception V3モデルは，ImageNet 2012イメージ分類タスクに対するトップ５の精度が，それぞれ89.6, 91.8, 93.9パーセントに改善されている。マシンが生成したキャプションの品質測定には，ひとつの自然言語から別の言語への文書翻訳の精度を測定するBLEU-4メトリックを使用するが，それによると，TensorFlowベースのアプローチは，これまでの中心的なモデルであるDistBeliefを2ポイント上回っている。

既存の実装から新たなモデルに移植し，改善する上で指摘されている問題のひとつは，イメージ内のオブジェクトを分類するプロセスに対する，イメージ内のオブジェクトを説明して他のオブジェクトに関連付けするプロセスだ。今回のモデルでは分類フェーズに加えて，オブジェクトを詳細に説明する上で有用な情報を取り出すことのできるように微調整されたフェーズを導入して，この問題に対処していると考えられる。オブジェクトを識別するイメージ分類フェーズと，形容詞と前置詞句を追加するフェーズ，文法的に適切で人間的なキャプション構造を与えるフェーズとを分けているのだ。

この例のイメージならば，まず列車が線路上にあること，続いて黄色と青であることが認識されて，それらが合成された結果として，線路上を走行する黄色と青の列車，というイメージが認識される。このケースでは，オブジェクトが動いているか静止しているかをモデルが決定可能かどうかではなく，トレーニングデータの中で，同様なイメージを記述した入力イメージキャプションがどのように説明しているかが問題となる。

新しいモデルは，学習済みのイメージキャプションのコンポーネントに組み入れることも可能なので，単一のトレーニング情報によらず，合成したコンポーネント全体で分類されたオブジェクトをユニークに組み合わせて，まったく新しいキャプションを生成することができる。こちらの例では，以前ならば存在しなかったキャプションが生成されている。

以前のモデル実装であるDistBeliefと，新しいTensorFlowベースのInception V3のトレーニング時間を比較したベンチマークによると，Nvidia K20 GPU上で3.0秒に対して0.7秒と，TensorFlowはDisBeliefに対して25%に短縮されている。TensorFlowベースのInception V3イメージ分類モデルに加えて，GoogleはInception-ResNet-v2のリリースについても言及したが，パフォーマンスに関するベンチマークはまだ公表されていない。トレーニングデータ自体は提供されていないが，イメージに対して人が作成したキャプションがトレーニングデータの基本になる。

この記事を評価

関連性

スタイル

編集者評
編集長アクション

提出著者連絡

この記事に星をつける

おすすめ度

スタイル

Author Contacted

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

AIと機械学習、データエンジニアリング

関連記事

特集コンテンツ一覧

InfoQ ニュースレター

毎週火曜日に前週のまとめコンテンツをお送りいたします。（日本語版は不定期リリース）25万人のシニアな開発者コミュニティーにぜひご参加ください。サンプルを見る

あなたのメールアドレスはこちら

国を選んでください。

InfoQ.com がプライバシーポリシーに従って私の個人情報を扱うことに同意します。

We protect your privacy.

デベロップメント
設計/アーキテクチャ
カルチャー＆手法
AIと機械学習、データエンジニアリング
DevOps

InfoQ ニュースレター

毎週火曜日に前週のまとめコンテンツをお送りいたします。（日本語版は不定期リリース）25万人のシニアな開発者コミュニティーにぜひご参加ください。サンプルを見る

様々なイノベーターとアーリーアダプターがお送りするテクノロジーの概要を見る。
自分がまだ知らないことに気づいていないと知る
あなたが興味のあるトピックスをいつでも最新な情報に。

あなたのメールアドレスはこちら

国を選んでください。

InfoQ.com がプライバシーポリシーに従って私の個人情報を扱うことに同意します。

We protect your privacy.

ホームアカウントを作る QCon Conferences Events 寄稿 InfoQのライター InfoQについて C4Mediaについて Diversity

Events

QCon London
March 16-19, 2026
InfoQ Architect Certification
Apr 15 - May 13, 2026
QCon AI Boston
June 1-2, 2026
QCon San Francisco
November 16-20, 2026

Follow us on

Stay in the know

The InfoQ Podcast

Engineering Culture Podcast

The Software Architects' Newsletter

サイト全般について feedback-jp@infoq.com 記事 editors-jp@infoq.com

InfoQ.com and all content copyright © 2006-2026 C4Media Inc.
InfoQ.com and all content copyright © 2026 SHIFT Inc.
プライバシー

BT