Apache Software FoundationがApache Kafka v.1.0.0を発表した。Streams APIの改善、メトリクス強化、ディスク障害への耐性向上、一般的なバグ修正などが含まれている。
Apache Kafkaはオープンソースの分散ストリーミングプラットフォームで、世界中の何千もの企業で利用されている。今回のリリースには次のような機能強化が含まれる。
- Streams APIに対する様々な改善。実行時にアクティブなタスクの状態を提供する新しいAPI、Builder APIの改善、新しいCogroup API、デバッグ機能の改善が含まれる。
- 新しいヘルスチェック、グローバルトピックとパーティションカウントなど、メトリクスに関する様々な改善。
- Java 9サポートによる高速なTLSとCRC32実装の導入。これにより通信回線上の暗号化が高速になる。
- 認証エラー処理の改善。
- ディスク障害への耐性改善。JBOD Brokerにおける1つのディスク障害により、Broker全体がダウンすることはなくなる。
すでに幅広く使われているにもかかわらず、これはApache Kafkaの最初のメジャーリリースだ。Kafkaの作者の一人であるNeha Narkhede氏は、その理由をこう説明する。
Apache Kafkaの場合、1.0までの時間は、安定性のためよりも、最初にKafkaを作った時から私たちとコミュニティが築いてきたビジョンを完全させるための方が多いでしょう。結局のところ、Kafkaは何年もの間、何千もの会社で実際に使われてきました。
特に、Narkhede氏はこのビジョンについて次のように語っている。
それは、私たちが思い描いたビジョンと私たちが構築を目指したもの、すなわち、企業規模でのトランザクションの正確性をもって、データストリームの読み書き・移動・処理ができるストリーミングプラットフォームです。
また、それを実現するためにKafkaが実行してきたイテレーションについても説明している。これには以下が含まれる。
- 連続したストリームを抽象化したようなログの導入。Publishは順序付きログへの追加、Consumeは指定オフセットからの連続読み出し。
- ログへのレプリケーションとフォールトトレランスの追加。
- ConnectとStreams APIの導入。Kafkaからのデータ取得と処理をしやすくするために使われる。
- ストリーム処理のExactly-onceセマンティクス。
Apache Kafkaはダウンロードできるようになっており、Narkhede氏のブログにはKafkaの構想から現在までの道のりが説明されている。
Rate this Article
- Editor Review
- Chief Editor Action