InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
データベースシャーディングアーキテクチャの新たな進化
今回の記事では、筆者のJuan Pan氏が、分散データベースシステムにおけるシャーディングアーキテクチャのパターンについて論じます。記事の中で氏は、Apache ShardingSphereプロジェクトがデータシャーディングの課題にいかに対処しているかを説明した上で、DistSQLを使って分散データベースと暗号化テーブルを生成する方法の実例2つを論じています。
-
AIはDevOpsに取って代わるのか?
AIツールは開発者の役割をゆっくりと - DevOpsがかって行ったように - 置き換えています。そして最終的には、DevOpsに完全に取って代わるでしょう。この予測の正しさを評価するのは難しいのですが、この記事では、AIが開発プロセスにもたらすものは何かを確認した上で、それが人間である開発者の作業を本当に引き継ぐことができるのか、数十年後のDevOpsがどのようなものになっているのかを見ていきます。
-
MLOpsの最適化がどのようにエンタープライズのAIに革命を起こすか
この記事では、著者のMonte Zweben氏が、データサイエンスのアーキテクチャ、コンテナ化、およびフィーチャーストアなどの新しいソリューションが機械学習プロセスのライフサイクル全体にどのように役立つかについて説明します。
-
Outboxパターンを使用したマイクロサービスのSagaオーケストレーション
変更データキャプチャを介して実装されたOutboxパターンは、マイクロサービス間のデータ交換の関心事に対処するための実証済みのアプローチです。この記事で示すように、Sagaパターンは、複数のマイクロサービスにまたがるデータ更新に役立ちます。
-
Kafka、MongoDB、Maxwell's Daemonを使用したSQLデータベース監査システムの構築
この記事では、従来の組み込みデータレプリケーションの枠を越え、Kafka、MongoDB、Maxwell's Daemonといったテクノロジを採用したデータベースの監査ログシステムと、その重要性について論じます。
-
マシンラーニングエンジニアとして採用されるには
マシンラーニングエンジニアになるには採用面接を受けなければなりません。書籍や教育コース、プロジェクトを通じて、関連するスキルを磨くことが必要です。履歴書にはテクノロジ、フレームワーク、プロジェクトを記載しましょう。面接では、技術的な質問や洞察的な質問、プログラム課題などが問われるかも知れません。技術的なタスクを与えられた時には、すでにその仕事を持っているかのようにスキルを発揮してください。
-
GPT-3対応アプリケーションの最初の波は、AIの未来のプレビューを提供します
GPT-3ベースのアプリケーションの最初の波が現れています。GPT-3は、ほんの数例を準備しただけで、エッセイを書いたり、質問に答えたり、コンピューターコードを生成したりすることができました。さらに、GPT-3は、そのような概念を教えられたことがないにもかかわらず、代数計算と言語翻訳を実行できます。 ただし、GPT-3は予測できない結果を伴うブラックボックスです。開発者はそれを応答的に使用する必要があります。
-
TornadoVM: GPUとFPGAでJavaを高速化する
近年の異種ハードウェアの急増は、CPUをターゲットとするJavaのような言語にとって問題となっています。TornadoVMはGraal JITコンパイラを拡張することでGPUやFPGAのメリットを活用し、フレキシブルでハイレベルなモデルを提供すると同時に、ハイパフォーマンスとライブタスクマイグレーションなどの機能を実現しています。
-
Amazon Deep Javaライブラリを使ってマシンラーニングをJavaで実装する
この記事では、JSR-381 VisRec APIを使うことで、DJLのトレーニング済モデルによる画像分類あるいはオブジェクト検出を10行未満のコードで実装可能であることを示します。
-
Deep Java Library(DJL)の紹介
Amazonは、ディープラーニングモデルをJavaで開発するためのオープンソースライブラリDJLを発表しました。この記事では同ツールキットの導入方法を紹介します。このライブラリは、PythonやRといった新たなテクノロジを導入することなく、Javaによるエンドツーエンドのディープラーニング開発を可能にすることで、ソフトウェア依存性の数を削減することを目的としています。
-
Redis StreamsとApache Spark Structured Streamingを使用したリアルタイムデータ処理
Apache Spark 2.0で導入されたStructured Streamingは、ストリーミングデータのためのSQLライクなインターフェースを提供します。Redis Streamsによって、Redisがストリーミングデータを複数のプロデューサとコンシューマの間で消費、保持、配信することができるようになります。この記事では、著者のRoshan Kumar氏が、RedisおよびApache Spark Streamingテクノロジを使用してストリーミングデータをリアルタイムで処理する方法について説明します。
-
リレーショナル NoSQLによる"バックトゥザフューチャー"
この記事では、分散トランザクションを備えたNoSQLデータベースの一貫性に関するいくつかの問題を取り上げるとともに、FanuaDBがCalvinプロトコルと仮想クロックを使って、それらの問題をいかに解決しているかを紹介します。