BT
x Merci de bien vouloir répondre au sondage InfoQ !
Vous êtes désormais en PLEIN ECRAN
QUITTER LE PLEIN ECRAN

Apache Spark : a practical feedback after implementing a data analysis workflow
Enregistré à :

par Guillaume Pitel le 09 mai 2014 |
  • Voir la Présentation
  •  
  •  
  •  
41:43

Résumé
Within a few months, we have rewritten the complete workflow for a data analysis engine: eXenGine. We'll give our feedback about using Apache Spark for implementing a proprietary matrix factorization method and analyzing Wikipedia for textual content, links and meta-data. Focus will be on the nice things we have found about Spark.

Bio

Founder, Chief Scientist @ eXenSa : #recsys and #textmining for #BigData. #MachineLearning, Startups. http://blog.guillaume-pitel.fr Paris · wikinsights.org

Let's get together and chat about machine-learning, natural language processing, large scale data analytics using open source tools such as Hadoop MapReduce, Shark, NoSQL databases, the semantic web and linked data.

Rien ne serait possible sans le soutien et la confiance de nos Sponsors :

Microsoft    Jenji
Feedback Général
Bugs
Publicité
Éditorial
Marketing
InfoQ.com et tous les contenus sont copyright © 2006-2016 C4Media Inc. InfoQ.com est hébergé chez Contegix, le meilleur ISP avec lequel nous ayons travaillé.
Politique de confidentialité
BT

Nous remarquons que vous utilisez un ad-blocker

Nous comprenons pourquoi vous utilisez un bloqueur de publicité. Nous avons cependant besoin de votre support pour qu'InfoQ reste gratuit. Aucune de vos données ne sont fournies à des tiers sans consentement préalable de votre part. Nous travaillons uniquement avec des sponsors pertinents pour nos lecteurs. S'il vous plaît, considérez le fait de nous ajouter en exception de votre ad blocker.