Início Big Data no InfoQ Brasil
Apresentações
Feed RSS-
Big Data, Performance, POSIX, Real Time Bidding e desafios da propaganda na web
Nessa palestra exploramos o desafio de analisar milhões de perfis de usuários por dia, na busca por otimização de campanha publicitárias na web, lidando com um fluxo cada vez maior de dados.
-
Machine Learning em ambiente de mineração de dados
Uma visão geral sobre técnicas de aprendizado de máquina e como utilizá-las em ambientes de data mining, permitindo a descoberta automática de informações. Baseada em exemplos práticos e um case real.
-
Utilizando ferramentas open source para reorganizar seus dados em informações concretas
Como seguir um caminho prático pelos emaranhados de termos e técnicas surgindo a cada dia em Data Science, e como transformar conjuntos de dados em informação – e por consequência em lucros.
-
Analisando e reduzindo grandes fluxos de dados em tempo real
Conheça técnicas que resolvem problemas em sist. distribuídos, com foco especial nos "streaming algorithms", explicando estruturas como HyperLogLog, Count-Min e Bloom filters.
-
Big Data otimizado: Arquiteturas eficientes para construção de Pipelines MapReduce
Como arquitetar Pipelines MapReduce eficientes usando o framework Apache Crunch e integrar pipelines com fontes de dados externas como Redis, MongoDB ou BDs relacionais – e mais.
-
Pesquisa e desenvolvimento no Facebook: detalhes da arquitetura e aprendizados
Facebook: sistemas distribuídos para armazenar/buscar quantidades gigantescas de dados, técnicas para lidar com notificações em tempo real e lições em produtos cross-platform para milhões de pessoas.
-
Hadoop como solução de Big Data
Conheça o Apache Hadoop, o sistema de persistência e processamento distribuído que vem se destacando como principal solução de Big Data.
-
Big Data e pesquisas em milhões documentos: um case brasileiro
Conheça uma solução desenvolvida para resolver o problema da busca em centenas de milhões de documentos jurídicos, equilibrando técnicas de NoSQL, full-text search e BDs relacionais.
-
Apache Cassandra e Brisk: alto desempenho e dados analíticos
Usando o banco NoSQL Apache Cassandra juntamente com o Brisk para a execução de grandes volumes de transações em tempo real, com obtenção de dados analíticos detalhados.