InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Prashanth Southekal氏、アプライドマシンラーニングを語る
DBP InstituteのマネージングプリンシパルであるPrashanth Southekal氏は、先月のEnterprise Data World 2019カンファレンスで、アプライドマシンラーニング(applied machine learning)と、さまざまなMLアルゴリズムの利用機会に関するワークショップを開催した。
-
MicrosoftがApache Spark向けの高性能C#およびF#サポートをリリース
Microsoftは、Apache Spark用の.NETのリリースを発表し、ビッグデータ計算エンジンに新しい高性能のC#とF#のバインディングを追加した。
-
SalesforceがEinstein Services製品にインテリジェンスを追加
最近のプレスリリースで、SalesforceはEinsteinプラットフォームへの機能追加を発表した。ローコード、ポイントアンドクリックの設定ベースのソリューションを使用してAIソリューションをSalesforce開発者および管理者に提供することを目的としている。このプラットフォームに最近追加された機能には、Einstein TranslationおよびEinstein Optical Character Recognition(OCR)がある。
-
Databricksがデータレイクの信頼性を高めるためにDelta Lakeをオープンソース化
Databricksは最近、ACIDトランザクションをApache Sparkおよびビッグデータワークロードにもたらすための、独自のストレージレイヤであるDelta Lakeのオープンソース化をを発表した。Delta LakeはすでにMcAffee、Upworkなどのいくつかの会社で使用されているが、DatabricksはApache Spark開発者の会社である。Delta Lakeは、データレイクがよく直面する異種データの問題に取り組んでいる。
-
MicrosoftがBingで活用する近似最近傍検索アルゴリズムをオープンソース化
オープンソースへのMicrosoftの最新の貢献であるSpace Partition Tree And Graph (SPTAG)は、Microsoft Bing検索エンジンで使用される近似最近傍検索(NNS)アルゴリズムの実装である。
-
Googleが弱い教師(Weak Supervision)をスケールし、ラベル付きデータセットの問題を克服
Googleは、機械学習(ML)におけるラベル付きデータの必要性が重大なボトルネックであることを認識しており、最近ではオープンソースのSnorkelフレームワークを大規模化の問題を解決するために採用した。GoogleはSnorkelをTensorflowと統合することで強化した。そこでは、データを共有するためにデータベースの代わりにファイルシステムを使用し、ラベル付け機能のために別々の実行ファイルを作成する。
-
MicrosoftがAnomaly DetectorとCustom Visionの2サービスを新たに提供、コグニティブサービスの範囲を拡大へ
Microsoftは先頃、 Anomaly Detectorのパブリックプレビューと、Custom Visionの一般供与を発表した。2つのサービスによってMicrosoftは、ユーザへのコグニティブサービス(Cognitive Service)の提供をさらに拡大する。
-
DeepMindのAIがStarCraftのトッププレイヤーに勝利
DeepMindのAlphaStar AI プログラムが最近、StarCraftの2人のトッププロプレイヤーに5-0で勝利した。
-
Condé Nastの自然言語処理とコンテント分析に関するQ&A
2015年の始めにCondé Nastは、自社の22ブランドにわたって作成されたコンテンツに関わるメタデータ改善を目的として、自然言語処理およびコンテンツ分析のエンジンを開発した。新システムによって、クリック率が30%向上したという。Condé Nast USでテクノロジマネージャを務めるソフトウェアエンジニアのAntonino Rau氏に、このHALと命名されたNLP・アズ・ア・サービスの進化について話を聞いた。
-
AmazonがSageMaker Ground Truthを更新し、新しいラベリング機能、ベンダーサポートを提供し、リージョンを拡大
Amazonは、SageMaker Ground Truthがシンプルなラベリングワークフロー、追加のラベリングベンダーのサポートを提供し、アジア太平洋(シドニー)AWSリージョンで利用可能になると発表した。それによって、アメリカ、ヨーロッパ、アジアで合計6つのAWSリージョンでサポートされる。
-
Xiaoya Wei氏,Airbnbのナレッジグラフを語る
Airbnbのナレッジグラフは,同社の持つ世界中のインベントリ情報をグラフ構造にエンコードしたもので,その構造は階層的分類に基づいている。InfoQはAirbnbのソフトウェアエンジニアであるXiaoya Wei氏にコンタクトを取り、同社のナレッジグラフと、それがどのようにインベントリを分類し、ユーザに旅行のコンテキストを提供する上で役立っているかを聞くことにした。
-
アジャイルの世界にAIを適用する
人工知能(AI)システムとアジャイルの世界の融合は,我々が構築するソフトウェアの開発方法やプロダクトのあり方に破壊的な影響力を持つ,とAidan Casey氏は言う。マシンラーニングとディープラーニングの組み合わせにより,真に人のように学習するアプリケーションの開発が可能になった。一方で,AIシステムの能力はトレーニングに使用したデータセットによって制限されるため,AIバイアスは非常に深刻な問題である。
-
GoogleがML Kitを拡張し、Smart ReplyとLanguage Identificationを追加
最近のAndroidブログ記事で、GoogleはML Kit向けの2つの新しい自然言語処理(NLP)機能のリリースを発表した。言語識別とスマートリプライである。どちらも、Googleは、開発者がテキスト、会話、その他の種類の自然言語テキストを分析および生成するのに役立つ、ドメインに依存しないAPIを提供している。
-
エンタープライズコンテンツ管理にインテリジェンスを提供するために、GoogleはDocument Understanding AIをリリース
最近のGoogle Cloud Next Conferenceで、GoogleはDocument Understanding AIと呼ばれる新しいベータ版の機械学習サービスを発表した。このサービスはエンタープライズコンテンツ管理(ECM)の業務をターゲットにしており、人工知能(AI)と機械学習(ML)を使用して、顧客が非構造化コンテンツからキーバリューペアを編成、分類、抽出できるようにしている。
-
機微データを保護するための新しい機械学習ライブラリ、TensorFlow Privacyの紹介
最近のブログ記事で、TensorFlowはTensorFlow Privacyを発表した。これは、研究者や開発者が強力なプライバシーを持つ機械学習モデルを構築できるようにするオープンソースライブラリである。このライブラリによって、強力な数学的保証に基づいて、トレーニングプロセスでユーザデータが記憶されないよう保証される。