InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
QCon New York 2023 初日を振り返る
2023年6月13日、ニューヨークのブルックリンにあるNew York Marriott at the Brooklyn Bridgeで、第9回QCon New Yorkカンファレンスの1日目が開催された。この3日間のイベントは、エンタープライズ開発コミュニティにおける偏りのないコンテンツと情報に焦点を当てたソフトウェアメディア会社であり、InfoQとQConのクリエーターであるC4Mediaが主催するものである。Radia Perlman氏による基調講演と、以下の4つのトラックからのプレゼンテーションが行われた。
-
生成AIアプリケーションの安全性を強化するNvidiaのNeMo Guardrails
Nvidiaの大規模言語モデル(LLM)向けの新しいNeMo Guardrailsパッケージは、開発者が有害または攻撃的なコンテンツや機密データへのアクセスなどといったLLMのリスクを防ぐのに役立つ。このイノベーションは、これらモデルの動作を制御するために複数の機能を提供し、より安全なデプロイを保証するものであるため、開発者にとって極めて重要だ。特に、NeMo Guardrailsは、LLMが有害または攻撃的なコンテンツを生成するリスクを軽減することで、AI主導が進む環境において必要不可欠なセキュリティレイヤーを提供する。
-
マイクロソフト、130億パラメータの言語・視覚チャットボット「LLaVA」をオープンソース化
マイクロソフト、ウィスコンシン大学マディソン校、コロンビア大学の研究者は、Large Language and Vision Assistant(LLaVA)をオープンソースで公開した。LLaVAは、CLIP画像エンコーダーとLLaMA言語デコーダーをベースにしており、指示実行データセットでファインチューニングされ、ScienceQAベンチマークで最先端の精度を達成している。
-
Javaニュースのラウンドアップ: Azul ZuluがCRaCをサポート、Spring BootのアップデートでCVEを緩和、OpenJDKのJEPをサポート
2023年5月15日の週のJavaラウンドアップは、OpenJDK、JDK 21、Azul Zulu、Spring Bootのポイントリリース、Spring Security、Spring Security Kerberos、Spring Integration、Spring Batch、Spring for GraphQL、Spring Authorization Server、Spring LDAP、Micronaut、Open Liberty、TornadoVM、Hibernate ORM、Apache TomEE、Apache Tika、OpenXava、JBang、JDKMonとSpring I/O カンファレンスからのニュースである。
-
Minecraftに初のLLM搭載エージェントが登場
カリフォルニア工科大学、スタンフォード大学、テキサス大学、NVIDIAの研究者は、GPT-4を利用してMinecraftのゲームプレイに参加するLLMパワーエージェント、Voyagerを共同開発しリリースした。Voyagerは、Minecraftで学習し、知識を保持し、卓越した専門性を発揮することで、驚くべき能力を発揮する。
-
OpenAIのオープンソースChatGPTプラグイン - Roy Miara氏とのQ&A
OpenAIは最近、言語モデルが外部のツールやデータベースにアクセスできるようにするChatGPTのプラグインサポートを発表した。また、知識検索プラグインのコードもオープンソース化され、組織はこれを使用して、独自の文書やデータへのChatGPTベースのアクセスを提供できるようになった。
-
Javaニュース ラウンドアップ: JDK 21アップデート、Spring Data 2023.0、JobRunr 6.2、Micronaut 4.0 Milestone
2023年5月8日のJavaラウンドアップは、OpenJDK、JDK 21、GraalVM Native Build Tools 0.9.22, Spring Framework, Spring Data and Spring Shell releases, Micronaut 4.0-M3, Quarkus 3. 0.3、Eclipse Vert.xリリース、Micrometer Metrics and Tracingリリース、Groovy 4.0.12、Tomcatリリース、Maven 3.9.2, Piranha 23.5.0, Reactor 2022.0.7, JobRunr 6.2, JDKMonリリース、Devoxx UKのニュースを掲載。
-
Googleのユニバーサルスピーチモデルが数百の言語の音声認識を実現
Google Researchは、1,200万時間以上のスピーチ音声で学習させた2Bパラメータの自動音声認識(ASR)モデルであるUniversal Speech Model(USM)を発表した。USMは、低リソース言語を含む100以上の言語の音声を認識でき、いくつかのベンチマークで新しい最先端の性能を達成した。
-
MetaのToolformer、APIを活用したゼロショットNLPタスクでGPT-3を引き離す
Meta AI Researchは、自然言語処理(NLP)タスクの解決を支援するためにAPIの呼び出しを学習する言語モデルToolformerを発表した。 Toolformerはモデルの微調整に使用されるトレーニングデータセットを自動的にアノテートし、いくつかのゼロショットNLPタスクの性能で大きくGPT-3モデルを引き離す。
-
AWSがAmazon BedrockとTitan基盤モデルでド派手に生成AIレース参入
AWSはAmazon BedrockとTitanの基盤モデルを発表し、生成AIレースへの参入を発表した。アマゾンは、生成AI技術へのアクセスを民主化し、さまざまな業界やユースケースの顧客に対応することを目的としている。この画期的な開発により、急速に成長するAI市場においてAmazonは手ごわい競争相手になる。
-
Metaが信頼性向上と運用の簡素化を目的に「MySQL Raft」へ移行
Metaは現在の準同期データベースとしてのMySQLを置き換えるために、MySQL Raftをデータセンターで展開している。新しいコンセンサスエンジンは運用を助け、MySQLサーバーがプロモーションやメンバーシップに責任を持つことを可能にしている。
-
OpenAI、GPT-4を用いてGPT-2でニューロンの行動を解釈
OpenAIの研究グループが最近発表した論文では、現在のディープニューラルネットワーク(DNN)の限界の1つである「解釈可能性の欠如」を解決するための新しいアプローチの概要が示されている。研究者たちはGPT-4を用いることで、DNNの解釈可能性を自動化するための第一歩として、どのような事象がニューロンの活性化を引き起こすかを解釈する技術を構築することを目的としている。
-
Metaが手がけるオープンソースなComputer Vision基盤モデルDINOv2
Meta AI ResearchはComputer Vision(CV)タスクの基盤モデルであるDINOv2をオープンソース化した。DINOv2は142Mの画像からなるキュレーションデータセットで事前学習されており、画像分類(Image Classification)、ビデオアクション認識(Video Action Recognition)、セマンティックセグメンテーション(Semantic Segmentation)、深度推定(Depth Estimation)などのタスクのバックボーンとして使用できる。
-
ChatGPTは何にでも適用可能か?アラン・チューリング研究所のフェローがDevoxx UK基調講演でチェックリストを発表
アラン・チューリング研究所の倫理フェローであるMhairi Aitken氏は、Devoxx UKの基調講演で、AIが人の言語の複雑さを処理するときの限界についてゲール語由来の自分の名前をAIが誤って発音したことを例にあげて語った。彼女はまずアラン・チューリング研究所で、社会における大規模言語モデルの社会的・倫理的リスクの予測に焦点を当てて研究していることを説明した。また、それらのリスクをどのように最小化できるか、そして責任を持って設計・開発された場合にデータやAIが社会全体に提供できる価値を理解しようと努めている。
-
半構造化データ変換のためのLLMの効率的な適用について
半構造化(Semi-Structured)データから構造化データを生成するための手段としてLLMは有効だが相応のコストを要する。スタンフォード大学とコーネル大学の研究チームは推論品質を向上させながら、推論コストを110分の1に削減する技術を発見したとしている。