InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
ML.NET - .NETエコシステムのための、オープンソースのマシンラーニングフレームワーク
Microsoftは今月初め、.NETエコシステム用のオープンソースのマシンラーニング(ML)フレームワークであるML.NETの、最初のメジャーバージョンをリリースした。ML.NETでは、C#またはF#を使用してカスタムMLモデルを開発することができる。開発したモデルは、感情分析、詐欺やスパムの検出、商品や映画のレコメンデーション、画像の分類、その他のシナリオへの適用が可能だ。
-
クラウドネイティブアプリケーション開発サポートが強化されたMicronaut 1.1
先日のGoogle Cloud Nextカンファレンスで、Object Computing、Inc.(OCI)は、Micronaut 1.1のリリースを発表した。gRPC、GraphQL、Google Cloud Platform(GCP)、RabbitMQ、Amzon Web Services(AWS)をサポートする。JDKのIntrospectorに代わる新しいBean Introspection API、Micronaut Testプロジェクト用の新たなテンプレートなどが新機能だ。
-
Xipeng Shen博士によるディープラーニングのトレーニング時間を短縮する新技術
ノースカロライナ州立大学の研究者らが先日の35th IEEE International Conference on Data Engineering (ICDE 2019)で、ディープニューラルネットワークのトレーニング時間を最大69%短縮可能な新手法について論文を発表した。
-
Googleがランドマーク認識および検索用の大規模データセットGoogle-Landmarks-V2をリリース
Googleは、Landmark RecognitionとRetrieval用に改良されたデータセットのGoogle-Landmarks-v2と、大規模なインスタンスレベルの画像認識用TensorflowコードベースのDetect-to-Retrieveをリリースした。Google-Landmarks-v2をベースとした2つのコンパニオンKaggle競技も同時にローンチされている。500万のイメージに200,000以上のランドマークを収めた、これまで公開された中で最大のランドマークデータセットだ。
-
GoogleがAI Platformをローンチ、エンドツーエンドでMLプロジェクトを構築・実行・管理
Googleは先頃、マシンラーニングモデルを開発、テスト、デプロイするためのエンドツーエンドのプラットフォームとして、AI Platformをローンチした。さまざまな製品やサービスをひとつのホストに統合することにより、企業がAIを使って複雑かつ困難な問題を、協調的かつ容易に解決できるようにする。
-
PyTorch 1.1がリリース -パフォーマンスを改善し、新たなAPIとツールを提供
Facebook AI ResearchがPyTorch 1.1のリリースを発表した。このオープンソースのディープラーニングフレームワークの最新版では、分散トレーニング、新API、TensorBoardのネイティブサポートを含む新たな視覚化ツール、などによってパフォーマンスが向上している。
-
TensorFlow.jsマシンラーニングライブラリを使って、Chrome Dinosaur Gameのプレー方法をコンピュータに教える
単純だが面白く、マシンラーニングの教育目的に適したアプリケーションが、先日、FritzのHeartBeat Mediumで公開された。ブラウザ内でGoogleのTensorFlow.jsマシンラーニングライブラリを活用して、Chrome Dinosaur Gameのプレー方法をコンピュータに教える、というものだ。
-
OpenAIはより長いシーケンスのディープラーニングのためのSparse Transformersを発表
OpenAIは、テキスト、音声、画像などの一連のデータを学習するためのディープニューラルネットワークアーキテクチャであるSparse Transformerを開発した。ネットワークは、より短いトレーニング時間で、いくつかのディープラーニングタスクにおいて最先端のパフォーマンスを達成できる。
-
Googleはコンピュータビジョンモデルの教師なしディープラーニングのためのTensorFlow Graphicsライブラリを発表
Google I/O 2019でのプレゼンテーションで、GoogleはTensorFlow Graphicsを発表した。TensorFlow Graphicsは、コンピュータビジョンにおける教師なしの学習タスクのためのディープニューラルネットワークを構築するためのライブラリである。このライブラリには、TensorFlowで記述された3Dレンダリング機能と、非矩形メッシュベースの入力データで学習するためのツールが含まれている。
-
Prashanth Southekal氏、アプライドマシンラーニングを語る
DBP InstituteのマネージングプリンシパルであるPrashanth Southekal氏は、先月のEnterprise Data World 2019カンファレンスで、アプライドマシンラーニング(applied machine learning)と、さまざまなMLアルゴリズムの利用機会に関するワークショップを開催した。
-
MicrosoftがApache Spark向けの高性能C#およびF#サポートをリリース
Microsoftは、Apache Spark用の.NETのリリースを発表し、ビッグデータ計算エンジンに新しい高性能のC#とF#のバインディングを追加した。
-
SalesforceがEinstein Services製品にインテリジェンスを追加
最近のプレスリリースで、SalesforceはEinsteinプラットフォームへの機能追加を発表した。ローコード、ポイントアンドクリックの設定ベースのソリューションを使用してAIソリューションをSalesforce開発者および管理者に提供することを目的としている。このプラットフォームに最近追加された機能には、Einstein TranslationおよびEinstein Optical Character Recognition(OCR)がある。
-
Databricksがデータレイクの信頼性を高めるためにDelta Lakeをオープンソース化
Databricksは最近、ACIDトランザクションをApache Sparkおよびビッグデータワークロードにもたらすための、独自のストレージレイヤであるDelta Lakeのオープンソース化をを発表した。Delta LakeはすでにMcAffee、Upworkなどのいくつかの会社で使用されているが、DatabricksはApache Spark開発者の会社である。Delta Lakeは、データレイクがよく直面する異種データの問題に取り組んでいる。
-
MicrosoftがBingで活用する近似最近傍検索アルゴリズムをオープンソース化
オープンソースへのMicrosoftの最新の貢献であるSpace Partition Tree And Graph (SPTAG)は、Microsoft Bing検索エンジンで使用される近似最近傍検索(NNS)アルゴリズムの実装である。
-
Googleが弱い教師(Weak Supervision)をスケールし、ラベル付きデータセットの問題を克服
Googleは、機械学習(ML)におけるラベル付きデータの必要性が重大なボトルネックであることを認識しており、最近ではオープンソースのSnorkelフレームワークを大規模化の問題を解決するために採用した。GoogleはSnorkelをTensorflowと統合することで強化した。そこでは、データを共有するためにデータベースの代わりにファイルシステムを使用し、ラベル付け機能のために別々の実行ファイルを作成する。