InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
ジェネレーティブAIサービス「AWS Bedrock」が一般提供開始
昨年4月にプレビュー版として発表されたBedrockだが、アマゾンはジェネレーティブAIアプリ向けのフルマネージドサービスの一般提供を発表した。
-
Semantic Kernel LLM Java SDKが利用可能になり、GenAIの統合が簡素化
大規模言語モデル(LLM)を一般的なプログラミング言語と統合するSDKであるSemantic Kernelが、Javaで利用可能になった。マイクロソフト社は最近のブログ記事で、Javaライブラリの登場を発表した。マイクロソフト社は今年初め、Semantic Kernelを初めてオープンソース化した。マイクロソフト社はSemantic Kernelを、AI LLMの統合を可能にする軽量SDKと呼んでいる。Semantic KernelSDKはJava以外に、C#とPythonプログラミング言語もサポートしている。
-
本番環境におけるLLM最適化のための、Hugging Faceのガイド
大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。
-
Amazon Opensearch Serverless用のベクトルエンジンがプレビュー開始
AWSは、Amazon OpenSearch Serverless内のベクトルストレージと検索機能のプレビューリリースを発表した。この機能は、機械学習によって拡張された検索体験と生成AIアプリケーションをサポートすることを目的としている。
-
ウェブ、プライベート、SaaSアプリケーション全体のデータセキュリティには"Cloudflare One Data Protection Suite"を
Cloudflareはこのほど、ウェブ、プライベート、SaaSアプリケーションなど、あらゆる環境でデータを保護するために設計された高度なセキュリティ・ソリューションの統一セットであるOne Data Protection Suiteを発表した。この製品はCloudflareのSecurity Service Edge(SSE)によって提供され、顧客は単一のプラットフォームから、クラウドにおけるコンプライアンスの合理化、データの露出とソースコードの損失の軽減、開発者とAI環境の安全性を実現できるとしている。
-
Ai4 2023 パネルディスカッション:ビジネスと社会における生成AI
先日開催されたAi4カンファレンスでは、"Generative AI in Business and Society (「ビジネスと社会における生成AI」)"と題したパネルディスカッションが行われた。重要なポイントは、生成AIは業務効率化と製品のパーソナライゼーションに多くの機会を提供すること、企業はプライバシーへの懸念とパーソナライゼーションのバランスを取る必要があること、そして生成AIが組織全体でどのように使用されているかを理解する必要があることである。
-
GPT-3.5 Turbo、品質と性能を向上させるための微調整が可能に
OpenAIはGPT-3.5 Turboを開発者が利用できるようにし、特定のユースケースのパフォーマンスを向上させるためにモデルをカスタマイズできるようにした。OpenAIによると、GPT-3.5 Turboをファインチューニングすることで、特定のタスクではGPT-4ベースの性能を上回ることもあるという。
-
Spring AI、OpenAIおよびAzure OpenAIとの連携機能を発表
SpringOneカンファレンスでSpring AIに関する実験的なプロジェクトが紹介された。これにより、同AIの基本的なコンセプトを用いたAIアプリケーションの制作が可能となる。現在、プロジェクトはAzure OpenAIとOpenAIをAIバックエンドとして統合している。コンテンツ生成、コード生成、セマンティック検索、要約などのユースケースがプロジェクトによってサポートされている。
-
OpenAI、ビジネスに特化したChatGPT Enterpriseを発表
OpenAIは、エンタープライズグレードの保護とプライバシー、より高速でのGPT-4無制限アクセス、より長い入力を処理するための拡張コンテキストウィンドウ、追加のデータ分析機能、カスタマイズの可能性などを提供するChatGPT Enterpriseを発表した。
-
ハイパフォーマンス・コンピューティング・ワークロードのための新しいGoogle Cloud H3仮想マシンシリーズがプレビューされる
Googleは最近、高性能コンピューティング(HPC)ワークロード向けに設計された新しいH3仮想マシン(VM)シリーズを発表した。同シリーズのVMは、Compute EngineおよびGoogle Kubernetes Engine(GKE)ユーザー向けにパブリックプレビュー版が提供されており、88コア(同時マルチスレッド無効)と352GBのメモリを搭載している。
-
AWS、モバイルおよびウェブアプリケーション向けの新しいクリックストリーム解析ソリューションを発表
AWSは最近、Clickstream Analytics on AWSという新しいサービスを発表した。 これは、企業のウェブアプリケーションやモバイルアプリケーション内のクリックストリームデータを収集、取り込み、分析、可視化するエンドツーエンドのソリューションだ。
-
Mojoプログラミング言語の紹介
Mojoは、PythonのシンプルさとRustのスピードとメモリの安全性を組み合わせた、新しく発表されたプログラミング言語である。開発の初期段階にあり、その機能を探求するためのオンラインプレイグラウンドをユーザーに提供している。Mojoはデータサイエンスと機械学習における卓越性を目指しており、Pythonに代わる高速な言語を提供する。オープンソース化も徐々に計画されている。
-
Grab、AWS上のKafkaコンシューマーのトラフィックコストをゼロに削減
Grabは、Kafka 2.3で導入された、Apache Kafkaコンシューマーが同じアベイラビリティゾーン(AZ)内のブローカーノードに接続する機能を利用し、再構成されたコンシューマーのAWS上のトラフィックコストをゼロに削減した。この変更により、AWS上でApache Kafkaを実行するための全体的なインフラコストが大幅に削減された。
-
Mountpoint for Amazon S3 がローカルファイルシステムのようにバケットにアクセス可能になった
最新のAWS Storage Dayイベントにおいて、AmazonはMountpoint for Amazon S3の一般提供を発表した。この新しいオープンソースのファイル・クライアントは、ファイル・インターフェイスを通じてAmazon S3の拡張性のあるストレージとスループットを提供し、各EC2インスタンスとオブジェクト・ストレージ間で最大100Gb/秒のデータ転送をサポートしている。
-
Jupyter NotebookにジェネレーティブAI機能を搭載
オープンソースのProject Jupyterは、Jupyter Notebookに強力なジェネレーティブAI機能をもたらす無料ツールJupyter AIをリリースした。