InfoQ ホームページ 設計/アーキテクチャ に関するすべてのコンテンツ
-
AWS Key Management Serviceが安全な通信のためにECDHをサポート
この夏、AWSはAWS Key Management Service (KMS)が楕円曲線ディフィー・ヘルマン(ECDH)鍵合意をサポートすると発表した。AWSのセキュリティチームは最近、新しい DeriveSharedSecret API が導出した共有シークレットを使って安全な通信チャネルを確立する方法を示した。
-
Cloudflareがスケーラブルでレジリエントなマルチステップアプリケーション構築のためのワークフローを発表
Cloudflareは、現在オープンベータ版となっているCloudflare Workersプラットフォーム上の耐久性のある実行エンジン「Workflows」を発表した。Workflowsを使用することで、開発者はネットワークの不安定さ、サーバーのダウンタイム、コードエラーなどの障害を乗り越えて持続可能なスケーラブルなマルチステップアプリケーションを作成でき、自動的な再試行や状態管理を手動のインフラ管理なしで実現できる。
-
RAG(Retrieval-Augmented Generation)を活用したCopilotが、Uberに13,000時間のエンジニアリング時間を節約
Uberは最近、オンコールサポートエンジニアの効率を改善するために設計されたAIを搭載したオンコールコパイロット、Genieを構築した方法を詳述した。GenieはRetrieval-Augmented Generation(RAG)を活用して正確なリアルタイム応答を提供し、インシデント対応のスピードと効果を大幅に向上させる。
-
LLMを精製し、そのパフォーマンスを超える:spaCyの創設者がInfoQ DevSummit Munichで語る
InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。
-
Logic Apps Standardのパブリック・プレビューで、生成AIアプリケーションのためのRAGベースの取り込みが可能に
マイクロソフトはこのほど、Logic Apps Standardのドキュメント解析とチャンキングのための組み込みアクションのパブリックプレビューを発表した。これらのアクションは、生成AIアプリケーションのRAG(Retrieval-Augmented Generation)ベースの取り込みを効率化するように設計されている。これらのアクションにより、Logic Appsはローコードで提供するAI機能にさらに投資することになる。
-
EC2もKubernetesも許さない:PostNLでのサーバーレス・オンリーアーキテクチャ構築からの洞察
PostNLは、外注委託のITプロジェクトデリバリーから社内の製品デリバリー能力への移行から得た洞察とガイダンスを共有した。特にサーバーレスサービスに重点を置いたクラウドネイティブ技術を採用することで、同社は運用コストを削減しながら、生産性と市場対応力の大幅な向上を達成した。
-
PayPal社、Cosmos.AI MLOpsプラットフォームにLLMを利用した生成AIサポートを追加
PayPal社はMLOpsプラットフォームCosmos.AIを拡張し、大規模言語モデル(LLM)を使用したジェネレーティブAIアプリケーションの開発をサポートする。同社は、ベンダー、オープンソース、自己調整LLMへのサポートを取り入れ、検索拡張生成(RAG)、セマンティックキャッシュ、プロンプト管理、オーケストレーション、AIアプリケーションのホスティングに関する機能をリリースした。
-
AWS Lambdaが、Visual Studio Codeをベースにしたエディタを導入し、高度な機能とAI統合を実現
AWS Lambdaは、Visual Studio Code Open Source(Code-OSS)エディタに基づく統合を特徴とする、コンソール内での新しいコード編集エクスペリエンスの提供を開始した。
-
マイクロソフト、Drasiを発表:リアルタイムイベント処理と自動化のためのオープンソースシステム
マイクロソフトのAzure Incubationsチームは、複雑なインフラにおけるクリティカルなイベントの検出簡素化するオープンソースシステムである、Drasiを発表した。Drasiはリアルタイムのモニタリングと自動応答を提供し、手作業によるイベント処理を不要にする。柔軟なコンポーネントと統合により、様々なデータソースにおける変更検知を合理化する。DrasiはApache 2.0ライセンスで提供され、イベントドリブンシステムを管理するための適応可能なソリューションを開発者に提供する。
-
クラウドコストの可視化を強化するGoogle Cloud Cost Attributionソリューション
Googleは最近、Google Cloud Cost Attribution Solutionを発表した。これは、メタデータとラベリングの改善を通じてコスト管理を強化するためのツールセットである。
-
Google CloudがMemorystore for ValkeyおよびRedis Clusterにスケーラブルなベクトル検索機能を追加
Google CloudはMemorystore for ValkeyとRedis Clusterにスケーラブルなベクトル検索機能を導入した。このアップデートにより、開発者は何十億ものベクトルに対して超低レイテンシーでベクトル検索を実行できるようになる。
-
汎用的で計算負荷の高いAmazon EC2 Graviton4インスタンスが利用可能になった
AWSはこのほど、最新のGraviton4プロセッサを搭載したEC2 C8gとM8gインスタンスをリリースした。汎用的なM8gインスタンスと計算負荷の高いC8gインスタンスは、Graviton3ベースのインスタンスと比較して最大30%の性能向上を実現するように設計されており、前世代のM7gとC7gと比較してコストは約10%向上している。
-
AWS、科学的発見を加速する並列Parallel Computing Serviceを発表
Amazon Web Services(AWS)は、複雑な科学計算の処理時間を大幅に短縮することを目的とした新しいAWS Parallel Computing Service(PCS)の一般提供を発表した。
-
NetflixのPushy:スケーラブルなウェブソケット・プラットフォームの進化:1億の同時接続を処理する
Netflixは、同社製品のプッシュ通知や様々なデバイス間の通信をサポートするWebSocketメッセージングプラットフォーム、Pushyの進化の詳細を共有した。Netflixのエンジニアは、プラットフォームのスケーラビリティと信頼性を確保し、新しい機能をサポートするために、Pushyのエコシステム全体で数多くの改善を実施した。
-
WS、Graviton4プロセッサを搭載したメモリ最適化EC2 X8gインスタンスをハイメモリワークロード向けに提供開始
AWSは、ハイメモリワークロード向けに設計されたGraviton4搭載メモリ最適化Amazon EC2 X8gインスタンスの提供を開始した。10種類の仮想サイズと2種類のベアメタル構成で利用可能なこれらのインスタンスは、最大3TiBのDDR5メモリと192個のvCPUを提供し、以前のモデルよりもパフォーマンスが大幅に強化されている。