Início Engenharia de dados no InfoQ Brasil
Apresentações
Feed RSS-
Ciclo de vida de um projeto de Data Science
Nessa palestra eu irei falar sobre como um projeto de Data Science é desenvolvido, desde da idéia inicial até o momento do deploy. Quanto tempo é gasto em cada etapa e como um projeto é desenvolv(...)
-
Serverless - Centralizando dados e orquestrando eventos sem servidor
Como criamos uma solução orientada a eventos e Data Warehouse de alta disponibilidade em tempo real com Google Cloud Functions e mudamos o mercado da contabilidade no Brasil.
-
Machine Learning e experimentos online para evitar o cancelamento de assinaturas no GloboPlay
Vamos explorar técnicas de Machine Learning utilizadas para reduzir o churn do GloboPlay principalmente para encontrar os assinantes mais prováveis de cancelar e as métricas correlacionadas, espe(...)
-
Architecture of an NLP Deployment
This talk explores the deployment of machine learning models as part of a larger system. The existing environment has an influence on available options. We will look at the different functional c(...)
-
Panel: Kaggle as stepping stone for a Data Scientist career
In this panel we will see a talk about data science competitions and how this can change your career.
-
Ciência de dados no mundo real com Serenata de Amor
É possível fazer ciências de dados no mundo real? Conheça mais sobre a Serenata de Amor, projeto que enfrentou todas as dificuldades de lidar com dados abertos governamentais e mostrou que é poss(...)
-
Data Lake além da buzzword
O objetivo dessa palestra é compartilhar os erros e acertos na implantação de um Data Lake através da análise de trade-offs e resultados de benchmarks realizados durante a jornada na Movile. Util(...)
-
Navigating Distributed Traces
Building off Jaeger's open source distributed tracing system, we designed XYS to allow for interactive exploration of inter-service latency histograms and to directly connect long tail latency me(...)
-
Validating Big Data Jobs - Stopping Failures before Production (w/ Spark, BEAM, & friends!)
The talk will have code examples in Apache Spark, as well as explore similar concepts in Apache BEAM (a cross platform tool), but the techniques should be applicable across systems. To keep the t(...)
-
Experimentações com grandes volumes de dados usando Notebooks
Notebooks são ferramentas usadas em Data Science que permitem a criação de documentos na web que integram código, gráficos, animações e textos possibilitando a criação de narrativas capazes de co(...)
-
Queries em Big Data: o poder dos bancos de dados NoSQL baseados em GPU
Tecnologias de bancos de dados NoSQL baseados em GPU estão emergindo como uma alternativa promissora para este problema. Nesta palestra, será apresentado como podemos nos beneficiar do alto poder(...)