InfoQ ホームページ data-science に関するすべてのコンテンツ
-
OpenAIのカスタムGPTが機密情報を漏洩する可能性
OpenAIが新しいGPTストアを展開し始めたことが報告された後、それらが構築されたデータの一部が容易に晒されてしまうことも発見された。複数のグループが、このシステムが機密情報を漏洩する可能性があることを指摘し始めた。
-
Mojoプログラミング言語の紹介
Mojoは、PythonのシンプルさとRustのスピードとメモリの安全性を組み合わせた、新しく発表されたプログラミング言語である。開発の初期段階にあり、その機能を探求するためのオンラインプレイグラウンドをユーザーに提供している。Mojoはデータサイエンスと機械学習における卓越性を目指しており、Pythonに代わる高速な言語を提供する。オープンソース化も徐々に計画されている。
-
Jupyter NotebookにジェネレーティブAI機能を搭載
オープンソースのProject Jupyterは、Jupyter Notebookに強力なジェネレーティブAI機能をもたらす無料ツールJupyter AIをリリースした。
-
AI、ML、データエンジニアリングニュースまとめ:Jupyter AI、AudioCraft、OverflowAI、StableCode、Tabnine
2023年8月7日までの記事で、人工知能、機械学習、データ・サイエンスの分野における重要な成果やリリースが紹介されている。今週の主なニュースは、Jupyter、Meta AI、Stack Overflow、Stability AI、Tabnineに関するものだった。
-
TensorFlow DTensor:分散ディープネットワークトレーニング向けの統合API
最近リリースされたTensorFlow v2.9では、モデル、データ、スペースパラレル(別名、空間タイル)ディープネットワークトレーニングのための新しいAPIが追加された。DTensorの目的は、シャーディング命令をモデルコードから分離することである。そのためにDTensorは、デバイス間でモデルとバッチパラメータを分割するための高レベルのユーティリティを提供する。
-
3世代のtensorプロセッシングユニットから得られた10の教訓
GoogleのTPUグループが発行した最近のレポートでは、3世代のテンソルプロセッシングユニットの開発から得られた10のポイントが挙げられている。著者はまた、彼らの以前の経験が将来のtensorプロセッシングユニットの開発にどのように影響するかについても議論している。
-
継続的な深層学習の評価:画像分類のための新しいベンチマーク
継続的な学習は、ディープネットワークトレーニングの反復全体で知識を保持することを目的としている。「CLEARベンチマーク:実世界の画像に関する継続的な学習」というタイトルの新しいデータセットが最近公開された。この研究の目的は、継続的な学習モデルをより現実的な比較をするために、オブジェクトの自然な時間進化を伴う一貫した画像分類ベンチマークを確立することである。
-
AppleがGCGCをオープンソース化:JavaGCログの分析ツール
AppleはGCGCをオープンソース化した。これは、Python 3とpandasをベースとしたJavaガベージコレクター(GC)ログの視覚化のためのツールである。
-
Julia 1.7でスレッド機能が拡張され、型推論が改善
Julia 1.7では、新しいスレッド機能、新しいパッケージマネージャー機能、型推論の改善、新しい構文機能など、多くの重要な機能強化があった。これは、Apple Siliconでネイティブに実行される最初のリリースでもある。
-
BasisAIのオープンソース、Boxkite機械学習モニタリングツールとは
Boxkiteは、高可用なモデルサーバにおけるコンセプトドリフトを追跡するために設計されたオープンソースのインストルメンテーションライブラリだ。Grafana、Prometheus、fluentd、kubeflowなどのDevOpsツールと統合し、コードやインフラストラクチャを変更することなく、複数のレプリカを作成して水平方向にスケーリングする。プロジェクトは、速く、正しく、シンプルであるべきと主張している。
-
PyodideがWebAssemblyを使ってPythonとその科学スタックをブラウザに提供
Mozillaは、Pyodideが、独立したコミュニティ主導のプロジェクトになったことを発表した。Pyodideは、その全てがブラウザで実行される完全なPythonデータサイエンススタックを提供することを目的としたプロジェクトである。Pyodideは WebAssemblyにコンパイルされたCPython 3.8インタープリターを活用しているため、IodideでPython、NumPy、Pandas、Matplotlib、SciPyなどを使用できる。IodideはWeb用の実験的なインタラクティブな科学計算環境である。
-
AWSがAmazon Finspaceと呼ばれるデータ管理および分析ソリューションを発表
最近、AWSは、Amazon FinSpaceと呼ばれる金融サービス業界(FSI)向けのデータ管理および分析ソリューションを発表した。このサービスは、金融アナリストが分析のためにあらゆる種類の財務データを見つけてアクセスするのにかかる時間を短縮することを目的としている。
-
Kaggleが機械学習とデータサイエンスに関する2020年の状況レポートを公開
Kaggleは、2020年の機械学習とデータサイエンスの現状に関するレポートを公開した。このレポートは、現在データサイエンティストとして雇用されている2,000人を超えるユーザからの調査回答に基づいている。
-
Juliaはプロダクションレディか? Bogumił Kamiński氏とのQ&A
JuliaCon 2020に続いて、SGHワルシャワ経済大学のBogumił Kamiński教授は、言語とそのエコシステムの状況を要約し、Juliaがついにプロダクションレディになったと述べた。InfoQは、Kamiński教授と話して変更を加えた。
-
データサイエンスチームにアジャイルを導入する
アジャイルはデータサイエンスチームの、ステークホルダとのコラボレーション改善と生産性向上に寄与する。優先順位が明確になることで、作業への集中と成果の提供が可能になるのだ。実践する上で重要なのは、アジャイルの旅に同行することによって、データサイエンスチームの賛同を得ることである。