InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
NVIDIA NIM、Hugging Faceで推論サービスとして利用可能に
Hugging Faceは、NVIDIA NIMによる推論サービスの提供開始を発表した。今回の新サービスで、開発者は主要なAIモデルのNVIDIAによる高速化された推論に容易にアクセスできるようになる。
-
大学の研究者らが新しいタイプの解釈可能なニューラルネットワークを構築
マサチューセッツ工科大学、カリフォルニア工科大学、ノースイースタン大学の研究者が、新しいタイプのニューラルネットワークを作成した、Kolmogorov–Arnold Networks(KAN)である。KANモデルは、物理モデリング・タスクにおいて、より大きなパーセプトロン・ベースのモデルを凌ぐ性能を示し、より解釈しやすい可視化を提供する。
-
Spring エコシステムが数々のマイルストーンのリリースを発表
2024年7月15日の週は、Spring エコシステムの話題に富んだ1週間だった。見どころは次のようなマイルストーンのリリースだ。今回リリースが発表されたのは、Spring Boot 3.4.0-M1、Spring Framework 6.2.0-M6、Spring Security 6.4.0-M1、Spring Session 3.4.0-M1、Spring Integration 6.4.0-M1、Spring Modulith 1.3.0-M1、Spring AMQP 3.2.0-M1、Spring for Apache Kafka 3.3.0-M1である。
-
Meta社、これまでで最大のオープンソースモデルとなるLlama 3.1 405Bをリリース
Meta社は最近、最新の言語モデルLlama 3.1 405Bを発表した。このAIモデルは、8Bと70Bバージョンも含む新しいLlamaモデルの中で最大のものである。4,050億のパラメータ、15兆のトークン、16,000のGPUを持つLlama 3.1 405Bは、様々な印象的な機能を提供する。
-
Elasticがオープンソースに回帰:コミュニティはついてくるか?
オープンソースとElasticの両コミュニティにとって驚くべき動きとして、Elasticの創設者兼CEOであるShay Banon氏は最近、ElasticsearchとKibanaを再びオープンソースにすると発表した。この2つの製品は間もなく、OSI承認のライセンスであるAGPLの下でライセンスされる。
-
Canva、SNS+SQSよりAmazon KDSを選択し、1日250億件のイベントで85%の節約を実現
Canvaは、同社のProduct Analytics Platformのために、AWS SNSとSQSの組み合わせ、MKS、Amazon KDSなど、さまざまなデータメッセージングソリューション群を評価し、主に費用面での大きな優位性から最終的にAmazon KDSを選択した。同社は、パフォーマンス、メンテナンスの労力、コストなど、これらのソリューションに対して多くの側面から比較を行った。
-
Alibaba、数学と音声チャット用の2つのオープンウェイト言語モデルをリリース
Alibabaは2つのオープンウェイト言語モデルファミリーをリリースした。Qwen2-Math は数学の問題を解くために調整されたLLMで、Qwen2-Audio は音声やテキスト入力を受け付けるマルチモーダルLLMである。両ファミリーはAlibabaのQwen2 LLMシリーズをベースにしており、Qwen2-Mathの最大バージョンを除くすべてがApache2.0ライセンスで提供されている。
-
GitHub Modelsが新しいAIプレイグラウンドと他のGitHubツールとの緊密な統合をもたらす
GitHubは、開発者がGitHubツールエコシステム内から様々なAIモデルを探索し、Azure AIを使用してAIベースのサービスを簡単にデプロイできるようにすることを目的とした無料の機能、GitHub Modelsを発表した。GitHub Modelsにはプライベートモデルとパブリックモデルがあり、現在はクローズドプレビュー版となっている。
-
Amazon Aurora Serverlessは10K以上のインスタンスのフリートに対して、どのようにリソースとスケーリングを管理するのか?
AWSのエンジニアが、Amazon Aurora Serverlessプラットフォームのリソース管理とスケーリングの進化と最新の設計について説明した論文を発表した。Aurora Serverlessは、顧客のワークロードのニーズを満たすために動的にリソースをスケーリングし調整するための全体的なアプローチを作成するために、異なるレベルのコンポーネントの組み合わせを使用する。
-
Amazon Q Apps、企業向け生成AIアプリの作成簡素化を目指す
Amazon Q Businessの���部であるAmazon Q Appsは、企業データを統合し、組織内で安全に共有できる生成AIアプリの作成を可能にする。一般提供開始とともに、AmazonはAmazon Q Apps用の新しいAPIと、より詳細なデータソース定義を発表した。
-
MariaDBがオープンソースのVectorプレビューを発表、MySQLのデフォルトオプションを目指す
MariaDB 11.6のリリースに伴い、MariaDB FoundationはMySQLエンジンのオープンソースフォークであるVector Searchのパブリックプレビューを発表した。データベースの専門家やオープンソースの支持者たちは、特に Oracle がほとんどの新機能をエンタープライズ エディションのみに提供していることから、VectorのサポートはMariaDBがMySQLのエコシステムをリードする機会だと考えている。
-
Pinterest、世界最大級のHBaseデプロイメントをシャットダウン
Pinterestのエンジニアリングチームは最近、メンテナンスとインフラコストの高さ、Hbaseエキスパートの不足、製品機能の制限のため、HBaseクラスタの廃止を文書化した。PinterestがTiDBや他のデータベース技術に移行したのに続き、コミュニティは、これがHadoopとHDFSの上で動作する非リレーショナルデータベースの衰退の別の兆候なのかどうか疑問に思っている。
-
ペンシルバニア大学の研究者がプロセッサ不要の学習回路を開発
ペンシルバニア大学の研究者らが、非線形回帰などのタスクを学習できるニューラルネットワークに似た電気回路を設計した。この回路は低電力レベルで動作し、コンピューターなしで学習できる。
-
Redisがマルチスレッド・クエリ・エンジンでベクトルセマンティック検索のパフォーマンスを向上
人気のインメモリ・データ構造ストアであるRedisは、最近、強化されたRedisクエリエンジンをリリースした。この開発は、ベクトル・データベースがGenAIアプリケーションの検索拡張世代(RAG)における重要性から脚光を浴びている時に行われた。
-
OpenAI、脱獄耐性を向上させたGPT-4o miniモデルをリリース
OpenAIは、同社のフラッグシップモデルであるGPT-4oの小型版であるGPT-4o miniをリリースした。GPT-4o miniはいくつかのLLMベンチマークでGPT-3.5 Turboを上回り、OpenAIの最初のモデルで、脱獄とシステムプロンプト抽出に対するモデルの耐性を向上させる命令階層メソッドで学習される。