BT
50:40

Data Science em Tempo Real com Storm

Postado por Fabiane Nardon  em  30 Jul, 2014

A maioria das aplicações de Data Science hoje se baseia no processamento em batch dos dados. Mas há um aumento de casos que processam imensas quantidades de dados em tempo real. Esta palestra irá mostrar uma solução usando o framework Storm; truques, armadilhas a evitar e aqueles segredos que apenas se aprende depois de processar terabytes de dados, serão apresentados com base em casos reais.

30:02

Big Data na prática: Resolvendo problemas de performance com Hadoop

Postado por Marcos Reis  em  25 Jul, 2014

Esta palestra mostrará os passos para se desenvolver uma solução usando algumas ferramentas que fazem parte do ecossistema do Hadoop: MapReduce, HDFS e HBase. Um típico programa Hadoop é composto de algumas fases como carregamento de dados no HDFS, operações MapReduce e recuperação do resultado do HDFS. Com base nessas características, analisaremos em que contexto o Hadoop pode fazer a diferença.

47:09

Arquiteturas na nuvem com os custos sob controle: processando bilhões de páginas na AWS sem estourar o cartão

Postado por Fernando Babadopulos  em  22 Jul, 2014

Conheça as lições aprendidas durante a concepção da arquitetura de nuvem utilizada pela TailTarget, uma empresa de data science que analisa o comportamento de navegação de usuários de internet. Essa arquitetura requer alto poder computacional. Veja erros comuns de arquitetura, como escalar na nuvem, quais pontos monitorar numa aplicação, além de truques de DevOps e deploy contínuo sem downtime.

45:11

Front-End Ops: Experiências em Build e Deployment

Postado por Daniel Filho  em  05 Dez, 2013

Para ser um desenvolvedor front-end, basta ter conhecimento em HTML, CSS e JavaScript, mas para ser um profissional completo, é necessário ir além. Existe muito mais do que essas tecnologias por trás de uma aplicação web. Nessa apresentação, são abordados os temas de build e deploy, utilizando ferramentas como GruntJS e Capistrano.

50:20

Escalando o pé de feijão: estratégias open source para automação na nuvem

Postado por Bruno Souza, Edson Yanaga  em  03 Dez, 2013

Explorando estratégias que aproveitam a versatilidade dos ambientes de cloud para automatizar atividades de alta complexidade. Partindo de ferramentas open source como Jenkins e Chef, veremos como automatizar atividades para reduzir a dependência de provedores de infra e plataformas, melhorar ambientes, e implementar processos de deployment e delivery contínuos cada vez mais sofisticados.

49:09

Big Data, Performance, POSIX, Real Time Bidding e desafios da propaganda na web

Postado por Tiago Peczenyj  em  26 Nov, 2013

Nessa palestra exploramos o desafio de analisar milhões de perfis de usuários por dia, na busca por otimização de campanha publicitárias na web, lidando com um fluxo cada vez maior de dados. Mostraremos como lidar com gargalos na consulta de dados, através do uso da interface POSIX, e seu impacto numa estrutura de Real Time Bidding, na busca pela menor latência possível.

47:37

Machine Learning em ambiente de mineração de dados

Postado por Everton Gago  em  07 Nov, 2013 2

Essa palestra apresenta uma visão geral sobre as técnicas de aprendizado de máquina e como podem ser utilizadas em ambientes de mineração de dados, permitindo a descoberta automática de informações. Toda a apresentação será baseada em exemplos práticos e ao final será mostrado um case real, onde aplicamos técnicas de machine learning para minerar dados de um grande município brasileiro.

39:55

Utilizando ferramentas open source para reorganizar seus dados em informações concretas

Postado por Fernando Meyer  em  05 Nov, 2013

Muito se fala do papel que os dados podem assumir no dia-a-dia de empresas, mas pouco se mostra como podem ser eficazes no auxílio das tomadas de decisões. Veja como seguir um caminho prático pelos emaranhados de termos e técnicas surgindo a cada dia neste campo que floresce como nova onda. Mostramos como transformar conjuntos de dados em informação – e por consequência em lucros.

47:24

Analisando e reduzindo grandes fluxos de dados em tempo real

Postado por Juan Lopes  em  25 Out, 2013

Qual a dificuldade de calcular a tamanho de um conjunto em um sistema distribuído? E de fazer isso sobre um fluxo quase infinito em tempo real? A apresentação introduz técnicas que resolvem esses problemas com abordagens determinísticas e probabilísticas. Será dado foco especial nos "streaming algorithms", explicando o funcionamento de estruturas como HyperLogLog, Count-Min e Bloom filters.

48:02

Big Data otimizado: Arquiteturas eficientes para construção de Pipelines MapReduce

Postado por Fabiane Nardon  em  16 Out, 2013 2

Essa palestra irá mostrar como arquitetar Pipelines MapReduce eficientes usando o framework Apache Crunch; como integrar pipelines com fontes de dados externas como Redis, MongoDB, ou mesmo BDs relacionais, e a melhor granularidade para seus jobs; além de identificar quando investir em uma arquitetura de MapReduce realmente faz sentido.

52:02

Continuous Delivery - Entrega Contínua

Postado por Edson Yanaga  em  30 Set, 2013 1

O Continuous Delivery está conquistando grande popularidade, misturando tópicos que envolvem os movimentos Agile e DevOps. O objetivo é entregar software de valor aos clientes de modo previsível, rápido e confiável. Com a Entrega Contínua torna-se possível entregar software (atualizar em produção) várias vezes por hora. Mas como fazê-lo? Por onde começar? Quais são as ferramentas necessárias?

Cloud para milhares: anatomia de uma nuvem pública

Postado por Rodrigo Campos  em  08 Nov, 2012

Nessa palestra são apresentados os componentes necessários para oferecer um ambiente de Cloud Público para milhares de usuários. Os tópicos abordados incluem garantia e isolamento de recursos, desempenho, monitoração, controles de segurança de rede, automação e orquestração do ambiente.

Feedback geral
Bugs
Publicidade
Editorial
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2014 C4Media Inc.
Política de privacidade
BT