InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
NumPy 1.20が実行時SIMDサポートと型アノテーションを加えリリースされた
新しくリリースされたNumPy 1.20は、パフォーマンスとドキュメントの改善を特徴としている。開発者は、NumPy関数に型アノテーションを使用できるようになった。SIMD(単一命令、複数データ)命令を幅広く使用すると、ユニバーサル関数(ufunc)の実行速度が向上する。NumPyのドキュメントには、さらに大きな改善が見られた。
-
TensorFlow 3D:自動運転車の3D知覚のためのディープラーニング
Googleは、TensorFlow 3Dをリリースした。これは、TensorFlow機械学習フレームワークに3Dディープラーニング機能を加えるライブラリである。新しいライブラリは、研究者が3Dシーン理解モデルを開発およびデプロイできるようにするツールとリソースを提供する。
-
Facebook、COVID-19患者の経過を予測するAIモデルをオープンソース公開
Facebook AI Research(FAIR)のチームとNew York University(NYU) School of Medicineは共同で、胸部X線を使ってCOVID-19患者の予後予測を行うディープラーニングモデルを開発した。比較調査の結果では、このモデルは人間の放射線科医を上回っており、病院における酸素吸入や集中治療の需要予測を支援するために使用できる。
-
BBCの分析プラットフォームの失敗に備えた設計
先週のInfoQ Liveで、BBCのプリンシパルシステムエンジニアであるBlanca Garcia-Gil氏が、データプラットフォームの進化する分析のセッションを行った。このセッション中、Garcia-Gil氏は、チームが「既知の未知」と「未知の未知」という2種類の障害にどのように備えて設計したかに焦点を当てた。
-
GoogleがDatabricksをクラウドプラットフォームに導入
最近、GoogleはDatabricksとのパートナーシップを発表した。フルマネージドのApache Spark製品とデータレイク機能をGoogle Cloudに導入するためである。この製品は、Google CloudでDatabricksとして利用できるようになる。
-
NLPライブラリのspaCy 3.0にTransformerベースのモデルと分散トレーニングが追加
AIソフトウェアメーカーのExplosionは、オープンソースの自然言語処理(NLP)ライブラリであるspaCyのバージョン3.0を発表した。新しいリリースには、最先端のTransformerベースのパイプラインと17言語用の事前トレーニング済みモデルが含まれている。
-
Googleは兆パラメータのAI言語モデルSwitch Transformerをオープンソース化
Google Brainの研究者は、自然言語処理 (NLP) AIモデルであるSwitch Transformerをオープンソース化した。このモデルは、最大1.6兆のパラメータにスケールアップし、T5 NLPモデルと比較して最大7倍のトレーニング時間を改善し、同等の精度を実現する。
-
Microsoftがニューラルテキスト読み上げAIへの限定アクセスを発表
最近、Microsoftは、Custom Neural Voiceと呼ばれるニューラルテキスト読み上げAIへの制限付きアクセスを発表した。このサービスにより、開発者はカスタム合成音声を作成できる。
-
PayPalは、次世代のデータ移動プラットフォームとしてApache AirflowとApache Gobblinを標準化
PayPalは最近、次世代のデータ移動プラットフォームを実装するために、Apache AirflowとApache Gobblinでどのように標準化されたかについて説明している。 PayPalエンジニアリングブログの最近のブログ投稿で、PayPalの技術スタッフのシニアメンバーであるJay Sen氏は、既存のデータ移動プラットフォームが複雑で管理しにくいエコシステムで、多くのツールとプラットフォームにどのように進化したか、そして、新しい実装への移行について詳しく説明している。
-
.NETニュース総まとめ - 2021年3月15日の週
今週は新しいAzure SDKやいくつものAkka.NETプラグインのリリース、多様性と包括性にフォーカスしたMicrosoftのディジタルイベントであるInclude 2021のストリーミングなど、.NETコミュニティにとって忙しい1週間だった。ここでは2021年3月15日からの1週間を振り返って、これらのイベントや.NETエコシステム内のちょっとしたストーリについて検証する。
-
-
Pinterestが階層化ドキュメントを効率的に検索するアーキテクチャについて解説
先日公開されたブログ記事で、Pinterestのエンジニアが、自社開発の検索エンジンで、階層的なドキュメントを取得する効率的な2ステージ検索アーキテクチャを実装した方法について説明している。氏らはこれを、インデックスの平坦化、正規化、非正規化を組み合わせることで実現した。
-
AWSがAmazon AuroraのPostgreSQL 12サポートを発表
AWSは最近、Amazon AuroraがPostgreSQLのメジャーバージョン12をサポートするようになったと発表した。Amazon Auroraはクラウド用に構築されたMySQL互換かつPostgreSQL互換のリレーショナルデータベースである。
-
Kaggleが機械学習とデータサイエンスに関する2020年の状況レポートを公開
Kaggleは、2020年の機械学習とデータサイエンスの現状に関するレポートを公開した。このレポートは、現在データサイエンティストとして雇用されている2,000人を超えるユーザからの調査回答に基づいている。
-
OpenAIが画像生成用のGPT-3モデルを発表
OpenAIは、GPT-3に基づいて12BパラメーターAIモデルをトレーニングした。GPT-3では、テキストの説明から画像を生成することができる。説明では、オブジェクトの位置や画像の遠近法など、多くの独立した属性を指定できる。そして、現実の世界には存在しないオブジェクトの組み合わせを合成することもできる。