InfoQ ホームページ Optimization に関するすべてのコンテンツ
-
Zendesk、DynamoDBからMySQLとS3へ移行し、コストを80%以上削減
Zendeskは、DynamoDBからMySQLとS3を使用した階層型ストレージソリューションに移行することで、データストレージのコストを80%以上削減した。同社は様々なストレージ技術を検討したが、コストを抑えつつ、クエリ性とスケーラビリティのバランスを取るために、リレーショナルデータベースとオブジェクトストアを組み合わせることにした。
-
LinkedIn、EspressoをHTTP2に移行し、接続数を88%、待ち時間を75%削減
LinkedInは、EspressoデータベースをHTTP/1.1からHTTP/2に移行することで、接続数、待ち時間、ガベージコレクション時間を削減し、性能と拡張性を劇的に向上させた。これらを改善するために、チームはNettyのデフォルトHTTP/2スタックを最適化し、ニーズに合わせる必要があった。
-
Spotifyはどのようにしてモバイルアプリのサイズをコントロールし、地球温暖化と戦っているのか
新しい機能の追加は、アプリのサイズに隠れた影響を与えることが多く、ユーザーの離脱や不必要な二酸化炭素排出など、いくつかの望ましくない影響がある。Spotifyのエンジニアは、アプリサイズをコントロールし続けるために、PR前とPR後のプロセスを確立し、6ヶ月間で推定10MBのアプリサイズの増加を防いだ。
-
本番環境におけるLLM最適化のための、Hugging Faceのガイド
大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。
-
Cloudflare(クラウドフレア)、ウェブパフォーマンスの最適化を自動化するスマートヒントを導入
CloudflareはSmart Hintsを導入し、Early HintsとFetch Prioritiesの手動設定を不要にした。Cloudflareのネットワークを活用することで、Smart Hintsは最適化プロセスを合理化し、手動設定を必要とせずにパフォーマンスを改善することを目指している。
-
AWS Lambda SnapStartによるJava Functionの高速化
昨年のre:Inventで、AWSはFaaS提供のAWS Lambdaのアップデートとして、Java Functionsのコールドスタートを軽減するLambda SnapStart機能を発表した。
-
SpotifyのRulerがAndroidアプリのサイズ最適化をサポート
Rulerは、Spotifyで開発されたオープンソースツールである。Androidアプリを分析し、開発者がアプリのサイズに最も影響を与えているコンポーネントを特定するためのガイドを提供する。
-
FacebookやGoogleに倣うAndroidアプリの起動時間の改善
最近の記事で、GoogleとFacebookのエンジニアが、Androidアプリが起動時に応答するまでの時間を短縮し、最適なユーザエクスペリエンスを確保する上での、最も重要なことのヒントを提供した。
-
OpenAIがAI処理最適化のためのPythonベースのプログラミング言語であるTritonをリリース
OpenAIは最新の言語Tritonをリリースした。このオープンソースプログラミング言語によって、研究者はAI処理用に非常に効率的なGPUコードを記述できる。TritonはPythonと互換性があり、ユーザはわずか25行のコードでエキスパート品質の結果を得ることができる。コードは、Tritonのライブラリを使ってPythonで記述し、GPUで実行するためにJITコンパイルされる。
-
V8は、パフォーマンスを向上させるために最適化しないコンパイラステージを導入
JavaScript V8エンジンの最新バージョンであるV8 9.1は、Sparkplugと呼ばれる新しい中間コンパイラのステージを導入している。実際のベンチマークでのパフォーマンスを5~15%向上させるとV8エンジニアのLeszek Swirskiは述べている。今後リリースされるChrome 91で利用できるようになる。
-
PreactチームがWMRをリリース、最新のWebアプリ開発を簡単に
3KBのReact互換ソフトPreactの作者であるJason Miller氏は先頃、*最新Webアプリのためのコンパクトなオールインワン開発ツール* WMRをリリースした。2MBのファイルひとつに収められ、依存関係をまったく持たないWMRは、事前インストールの不要なnpmパッケージのインポートに加えて、開発や運用に関して開発者が慣例とする多くの機能(ホットモジュールローディング、JSX、CSSモジュール、TypeScriptなど)をサポートする。
-
新しいFacebook.comの最適化戦略 - React ConfでのAshley Watkins氏の講演
Ashley Watkins氏は、React Confで、FB5、新しいfacebook.comを強化するテクノロジーと戦略のいくつかについて話し合い、データ駆動の依存、段階的なコードとデータのダウンロードなどのトピックに取り組んだ。
-
GoogleがTensorFlowモデル最適化のためのQuantization Aware Trainingをリリース
Googleは、TensorFlow Model Optimization Toolkit用のQuantization Aware Training(QAT)APIのリリースを発表した。QATは、ニューラルネットワークトレーニングプロセス中に低精度のハードウェアをシミュレートし、全体的なネットワーク損失メトリックに量子化誤差を追加する。これにより、トレーニングプロセスがトレーニング後の量子化の影響を最小限に抑えられる。
-
詳細なベンチマークにより、Webアプリ向けの人気のビルドツールをランク付け
Googleのweb.devチームは最近、人気のあるWebアプリケーションバンドラーを比較する詳細なベンチマークをリリースした。最初のリリースでは、browserify、parcel、rollup、webpackバンドラーを6つのディメンションと61の機能テストでテストするものである。ベンチマークは、特定のプロジェクトの特定のニーズに適合するバンドラーを選択するための、関連性のある構造化された比較基準を開発者に提供することを目的としている。
-
Google Propellerが大規模LLVMバイナリからさらなるパフォーマンスを引き出す
Google Propellerは、実行時の動作のプロファイルに基づいてLLVMバイナリを再リンクおよび最適化することにより、LLVMバイナリのパフォーマンスを向上させることができる。Googleのエンジニアによると、Propellerは、以前はLLVMによって高度に最適化されていたバイナリの主要なパフォーマンスベンチマークを2~9%向上させることができる。