InfoQ ホームページ ニュース
-
クラウドでのテスト駆動開発の適用
クラウドでは、アプリケーション開発を、それに付随するインフラと一緒にエンドツーエンドで扱うことができる。これにより、テスト駆動開発(TDD)やリファクタリングをアプリケーション全体で使用することが可能になり、メンテナンスコストを下げることができる。
-
表現力豊かなコーディングを可能にする「レコードパターン」でJavaがパワーアップ
JEP 440, レコードパターンは、JDK 21のためにProposedからTargetedに昇格された。このJEPは、この機能を最終化し、過去2回のプレビューからのフィードバックに対応した機能拡張を組み込んでいる。JEP 432Record Patterns (Second Preview)(JDK 20で提供)、JEP 405Record Patterns (Preview)(JDK 19で提供)だ。この機能は、レコード値を分解するためのレコードパターンを持つ言語を強化するものだ。
-
Amazon Prime VideoがサーバーレスからEC2、ECSに切り替えて運用コスト削減
Amazonの動画配信サービス「Prime Video」は、運用コストの削減とスケーラビリティの問題を解決するために、Audio/Videoの品質検査ソリューションを再構築した経緯を説明している。EC2とECSにワークロードを移行した結果、運用コストの90%削減を達成したという。
-
Quarkus 3.0をリリース: Jakarta EE 10のサポートでクラウドネイティブなJava開発を改善
6回のアルファ版リリース、ベータ版リリース、2回のリリース候補を経て、Red Hatは先週、待望のQuarkus 3.0リリースを発表した。このアップデートでは、Jakarta EE 10、MicroProfile 6.0、Hibernate ORM 6.2、Hibernate Reactive 2.0のサポートなど、多数の新機能が追加されている。さらに、Dev UIは、より拡張性が高く、ユーザーフレンドリーなものに刷新され、最新のデザインと操作感を示しているのだ。さらに、Quarkus 3.0では、Reactive Streamsの代わりにJava Flow APIを利用するようになったSmallRye Mutiny 2.0.0へのアップグレードが導入されている。
-
Googleのユニバーサルスピーチモデルが数百の言語の音声認識を実現
Google Researchは、1,200万時間以上のスピーチ音声で学習させた2Bパラメータの自動音声認識(ASR)モデルであるUniversal Speech Model(USM)を発表した。USMは、低リソース言語を含む100以上の言語の音声を認識でき、いくつかのベンチマークで新しい最先端の性能を達成した。
-
MetaのToolformer、APIを活用したゼロショットNLPタスクでGPT-3を引き離す
Meta AI Researchは、自然言語処理(NLP)タスクの解決を支援するためにAPIの呼び出しを学習する言語モデルToolformerを発表した。 Toolformerはモデルの微調整に使用されるトレーニングデータセットを自動的にアノテートし、いくつかのゼロショットNLPタスクの性能で大きくGPT-3モデルを引き離す。
-
AWSがAmazon BedrockとTitan基盤モデルでド派手に生成AIレース参入
AWSはAmazon BedrockとTitanの基盤モデルを発表し、生成AIレースへの参入を発表した。アマゾンは、生成AI技術へのアクセスを民主化し、さまざまな業界やユースケースの顧客に対応することを目的としている。この画期的な開発により、急速に成長するAI市場においてAmazonは手ごわい競争相手になる。
-
マイクロソフト、ラーニングルームでAzure Learningを強化
マイクロソフトはラーニングルームでAzureを学習するための新しいサービスを発表した。これは学習者がAzureに関心を持つ他の学習者や技術者とつながるように設計されたマイクロソフト Learn communityの一部として提供される。
-
Google Maps、Aerial View APIをプレビューリリース
先日のGoogle I/Oカンファレンスで、クラウドプロバイダーは、観光地の映画のようなビデオにアクセスする新しいオプションであるAerial View APIのプレビューリリースを発表した。Google Mapsのその他の改良点として、ルートのイマーシブビュー、フォトリアリスティック3Dタイル、新しいルートのカスタマイズ機能、再利用可能なウェブコンポーネントが挙げられる。
-
Metaが信頼性向上と運用の簡素化を目的に「MySQL Raft」へ移行
Metaは現在の準同期データベースとしてのMySQLを置き換えるために、MySQL Raftをデータセンターで展開している。新しいコンセンサスエンジンは運用を助け、MySQLサーバーがプロモーションやメンバーシップに責任を持つことを可能にしている。
-
OpenAI、GPT-4を用いてGPT-2でニューロンの行動を解釈
OpenAIの研究グループが最近発表した論文では、現在のディープニューラルネットワーク(DNN)の限界の1つである「解釈可能性の欠如」を解決するための新しいアプローチの概要が示されている。研究者たちはGPT-4を用いることで、DNNの解釈可能性を自動化するための第一歩として、どのような事象がニューロンの活性化を引き起こすかを解釈する技術を構築することを目的としている。
-
Metaが手がけるオープンソースなComputer Vision基盤モデルDINOv2
Meta AI ResearchはComputer Vision(CV)タスクの基盤モデルであるDINOv2をオープンソース化した。DINOv2は142Mの画像からなるキュレーションデータセットで事前学習されており、画像分類(Image Classification)、ビデオアクション認識(Video Action Recognition)、セマンティックセグメンテーション(Semantic Segmentation)、深度推定(Depth Estimation)などのタスクのバックボーンとして使用できる。
-
AWS、データ取り込みを効率化するAmazon OpenSearch Ingestionを発表
AWSはAmazon OpenSearch Serviceの機能として、Amazon OpenSearch ServiceドメインまたはAmazon OpenSearch Serverlessコレクションにデータを受信、変換、配信するサーバーレス、オートスケール、マネージドデータコレクターを提供するAmazon OpenSearch Ingestionを発表した。
-
ChatGPTは何にでも適用可能か?アラン・チューリング研究所のフェローがDevoxx UK基調講演でチェックリストを発表
アラン・チューリング研究所の倫理フェローであるMhairi Aitken氏は、Devoxx UKの基調講演で、AIが人の言語の複雑さを処理するときの限界についてゲール語由来の自分の名前をAIが誤って発音したことを例にあげて語った。彼女はまずアラン・チューリング研究所で、社会における大規模言語モデルの社会的・倫理的リスクの予測に焦点を当てて研究していることを説明した。また、それらのリスクをどのように最小化できるか、そして責任を持って設計・開発された場合にデータやAIが社会全体に提供できる価値を理解しようと努めている。
-
半構造化データ変換のためのLLMの効率的な適用について
半構造化(Semi-Structured)データから構造化データを生成するための手段としてLLMは有効だが相応のコストを要する。スタンフォード大学とコーネル大学の研究チームは推論品質を向上させながら、推論コストを110分の1に削減する技術を発見したとしている。