JVMの比較を目的とする新しいパフォーマンスベンチマーク”Renaissance”

原文(投稿日：2019/06/06)へのリンク

Charles University、Oracle Labs、およびいくつかの大学の研究者たちが、Java Virtual Machineのパフォーマンステスト用の新たなベンチマークとしてRenaissanceをリリースした。JVMで開発を行う開発者は、この明確なベンチマークを使ってリリース間のパフォーマンスを測定することにより、特定のJVM上での自身のアプリケーションの動作について、理解を深めることが可能になる。

Renaissanceは、Java 8(2014)からJava 12(2019)までリリースされている同時実行機能を、より詳しくテストすることを目的とする。含まれているテストは、DaCapoやSpecJVM2008など、他のベンチマークで使用されている多くのテストを拡張したものだ。全体としては、並行性と同時実行性を重視した21のベンチマークがあり、JavaとScalaのコードをカバーする。JVMをベンチマークする一般的なテストのひとつとしては、IBMがJavaパフォーマンスに対するハードウェア変更の影響を実証するために使用しているSpecJBB2015がある。

Renaissanceホワイトペーパの著者12人中の5人は、Oracle LabsでGraalVMに従事している。GraalVMは新しい多言語仮想マシンで、Javaを含む多くのソフトウェア言語を単一のランタイムで実行するように設計されている。GraalVMはコミュニティとコマーシャルエンタープライズの２エディションで提供されており、各エディションにはホットスポットモードとネイティブイメージの2つの操作モードがある。HotSpotモードはOpenJDKのHotSpot実装にちなんで命名されたもので、OpenJDKに完全に準拠し、Javaテスト互換性キットをパスしている。もうひとつの運用モードであるネイティブイメージでは、クローズドワールドの仮定を採用して、Javaアプリケーションをネイティブマシンコードにコンパイルする。さまざまな理由のため、Java SEの互換性定義は満足しないが、クローズドワールドの前提に適合するアプリケーションの実行が可能だ。ExcelsiorのシニアソフトウェアエンジニアであるNikita Lipsky氏は、2004年にSun Microsystemsによって定義された、ネイティブイメージの互換性の問題を提起した。"ひとつの例は、プロダクトが'すべての構成'において互換性のあることを要求するルールの存在です。テストに合格するために特別な構成を使用して、実際には互換性のない別の構成を顧客に推奨するようなことは許されません。そう、そのようなトリックが使われたことがあったのです。"

InfoQはOracleと連絡を取って、Renaissanceベンチマークで公開されている数値が互換性のあるHotSpotモードで生成されたものであり、従って他のJVMとの比較が可能である、ということを確認した。

全体的なパフォーマンス報告では、GraalVMのコミュニティエディションがOpenJDKと同等であり、エンタープライズエディションはもっとよいスコアを出している。下のグラフは、高いほどよい結果を表している。
ルネサンスの結果

Renaissanceのリリースによって、同ベンチマークの測定対象と関与や関連を持たない他のJava実装との間で混乱が発生している。競争力のあるベンダが公正なベースラインとして同意した環境を管理するSPECとは異なり、Renaissanceに参加したVMベンダはGraalVMのみだ。12人の著者のうち7人は異なる大学の出身だが、そこに競争的な側面は存在しない。 "ベンチマークゲームでは信頼性が重要なのです。ベンダのベンチマークは利益相反でいっぱいです。新しいベンチマークスイートならば、なおさらです。(特別に最適化された)ベンダプロダクトの結果が示されたベンチマークスイートでは、さらになおさらです"と、Red HatでShenandoahガベージコレクタの開発に従事する、パフォーマンス専門家のAleksey Shipilev氏は述べている。

"'新ベンチマーク'が開発されたタイミングは、おそらく偶然ではないでしょう。ですが、それも悪いことではありません。これがJVMのパフォーマンスの比較に使用可能な真のベンチマークかどうかは、時間が証明してくれるでしょう。" AzulのCTOであるGil Tene氏は、このように説明する。"レースは、競技者が現れて、同じスタートラインに立って初めてレースなのです。[Renaissanceが」真のベンチマークならば、'適応で右往左往'することなく、安定して同じ形を保つはずです。そうすれば他のベンダも、ベースラインとなる結果を安定的に再現することが可能になるため、実装間を実際に比較する結果測定が始まるでしょう。"

Shipilev氏は、ベンチマークを単にそのまま実行することを、スタートラインと定義することの難しさを、次のように説明している。"スイートは'オープンソースで変更が可能'なのですから、'ベンチマークは公平に選択された'というのは危険であって、現在の問題を解決するものではありません。"

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは Java です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

Anthropicリード：エージェント型ループへの人間の関与維持にはMarkdownよりHTMLが有効に

GitHub社、2026年に向けたよりグローバルでAI課題に直面するオープンソースエコシステムを提示

AnthropicがClaude Code品質苦情の6週間を3つのプロダクト変更の重なりと特定

AIがソフトウェアライフサイクルの上流へ：コードレビューからPRDガバナンスへ

CloudflareがProject Thinkを発表：AIエージェント向け永続ランタイム

Dropbox社がGitHub社と協力し、モノレポのサイズを87GBから20GBに削減

プラットフォームエンジニアリングのインパクトをドライブし、測定する

エージェンティックAIパターンがエンジニアリング規律を強化

人工知能によって顧客とのつながりはどう変わるか

GoogleのAletheiaが完全自律型AIエージェンティック数学研究の最先端を突き進む

Anthropic解説、Claudeが自身の実行ハーネスを構築する仕組み

DuckDB、HTTPベースのクライアント／サーバープロトコル「Quack」を発表　マルチユーザー分析に対応

Amazon CloudWatch、OpenTelemetryメトリクス対応をプレビュー公開

Googleがノードプール自動作成速度を向上、GKEクラスタ向け

Argo CD 3.3、安全なGitOps削除と円滑な日常運用を実現

Online InfoQ AI Engineering Certification

Online InfoQ Architect Certification

Online InfoQ Engineering Leadership Certification

Online InfoQ AI Security & Privacy Engineering Program

QCon San Francisco

QCon AI New York

QCon London 2027