Sortie d'Apache Flink 0.8.0, Feuille de route pour 2015 publiée

Apache Flink a publié la version 0.8.0 de leur projet. Outre les améliorations des performances, de compatibilité et de stabilité habituelles, il a également ajouté l’API de streaming Scala, où les capacités de streaming étaient jusqu'à présent absentes. Apache Flink a également été récemment promu pour passer au plus haut niveau des projets Apache après avoir rejoint l'incubateur il y a environ neuf mois.

Apache Flink est un projet open source avec des objectifs similaires tels que Apache Spark. Il fonctionne au-dessus de la stack Hadoop et vise à faciliter l'écriture des systèmes scalables de traitement de données en fournissant des opérations de données plus puissantes que les opérations de base map/reduce du système Hadoop original.

Kostas Tzoumas, committer Flink et co-fondateur de data Artisans, une startup basée à Berlin autour d'Apache Flink, a récemment publié les diapositives d'une présentation qui constitue une introduction à Flink et décrit la feuille de route pour 2015.

Un point-clé de Flink, qui le démarque également de la version actuelle d’Apache Spark, est qu'il utilise une approche similaire à l'optimisation des requêtes dans les bases de données SQL. Il peut appliquer des optimisations globales à une requête afin d’obtenir une meilleure performance. Par exemple, Flink est capable de réorganiser les opérations pour améliorer les performances, ou sélectionner les différentes implémentations à exécuter un opérateur donné en fonction des propriétés de l’ensemble des données concernées.

Tel que discuté dans la présentation, ceci permet à Flink d’exécuter une séquence d'opérations en mode pipeline, alors que Spark devrait les exécuter les unes après les autres.

Flink fournit également des opérateurs comme les itérations pour obtenir plus de potentiel d'optimisation globale. Ainsi, au lieu d'émettre des requêtes dans une boucle for, Flink permet aux utilisateurs de formuler l'itération comme faisant partie de la requête.

Les éléments de la feuille de route pour 2015 comprennent une meilleure gestion de mémoire et la tolérance aux pannes, le support pour une utilisation interactive, les lots unifiés et le streaming et l'intégration de la bibliothèque de machine d'apprentissage Mahout parmi d’autres.

Initialement, Flink a commencé dans le cadre du projet de recherche en cours Stratosphere. Flink est également la plate-forme principale pour le Big Data Center de Berlin (Berlin Big Data Center), une initiative de recherche financée par le gouvernement allemand dans le but de réunir les chercheurs de l'apprentissage automatique et les chercheurs de traitement scalable des données.

Débloquez l'expérience InfoQ complète

Vous n'avez pas encore de compte InfoQ ?

Sujets

Comment Utiliser Le Chiffrement Pour La Défense En Profondeur Dans Les Apps Natives Et Navigateurs

Manipulation De Données Avec Programmation Fonctionnelle Et Requêtes Dans Ballerina

Les Prédictions De Temps Chez Uber Eats

Les Processus De Tests Individuels Ne Peuvent Convenir A Tout Le Monde.

Pourquoi La Gouvernance DevOps Est Cruciale Pour Permettre La Vélocité Des Développeurs

Liens utiles

Sélectionner votre région

Evaluer cet article

Ce contenu est dans le sujet Architecture

Sujets liés

Contenu éditorial lié

Contenu sponsorisé lié

Contenu Éducatif

La Nouvelle Version D'Asahi Linux Prend En Charge Les Processeurs Apple M1 Ultra Et M2

PostgreSQL 14 Casse Les Pilotes .NET Et Java Pour PostgreSQL

Docker Desktop 4.6 Pour Mac Améliore Les Performances De Partage

Comment Eviter Le Verrouillage Des Fournisseurs Sans Serveurs Avec Design Patterns ?

Manipulation De Données Avec Programmation Fonctionnelle Et Requêtes Dans Ballerina

Ballerina : Un Langage De Programmation Orienté Données

La Dette Technique Est Quantifiable En Tant Que Dette Financière : Impossible Pour Les Développeurs

Les Tests De Performance Doivent S'Appuyer Sur Les Tendances

Les Processus De Tests Individuels Ne Peuvent Convenir A Tout Le Monde.

Grab A Partagé Son Experience Sur La Conception De Plate-formes De Données Distribuées

Microsoft Research Développe un Nouveau Système de Language-Vision : VinVL

Les Prédictions De Temps Chez Uber Eats

Les Facteurs Clés De La "MFA Fatigue" Dont A Ete Victime Uber

Adoption D'Environnements De Développement À Distance Chez Slack

Pourquoi La Gouvernance DevOps Est Cruciale Pour Permettre La Vélocité Des Développeurs

QCon London

QCon AI Boston

QCon San Francisco