Início Bancos de dados no InfoQ Brasil
Artigos
Feed RSS-
O que cientistas e engenheiros de dados precisam saber sobre o GDPR?
Andrew Burt fala sobre as implicações do GDPR na coleta, armazenamento e uso de dados para qualquer organização que lida com dados de clientes na União Europeia (UE).
-
FPGAs superam desempenho computacional
Originalmente utilizado para desenvolvimento de novos hardwares, os FGPAs em nuvem estão tornando esta tecnologia mais acessível. As melhorias em velocidade e baixo custo, quando comparado às CPUs, indicam que novas companhias podem se beneficiar desta tecnologia. FPGAs são fundamentalmente concorrentes, tornando-se ideais para ferramentas de dados intensos e problemas de processamento paralelo.
-
Big Data e Big Money: O papel dos dados no setor financeiro
Quando consideramos os 3 Vs de big data — volume, velocidade e variedade — é difícil pensar em quais setores os requisitos se encaixam tão bem quanto nas diretrizes de finanças.
-
Série de artigos: Entendendo data science
Nesta série, exploramos maneiras de compreensão de data science, incluindo o entendimento de onde sua aplicação é ou não é necessária e como torná-la um ativo para você. O conteúdo dessa série é produzido por pessoas que já viveram e resolveram muitos dos desafios da aplicação de data science.
-
Big Data com Apache Spark Part 3: Spark Streaming
Este é o terceiro artigo da série Big Data com Apache Spark. Nos 2 primeiros artigos abordamos o processamento de dados estáticos. Neste artigo trataremos do processamento de dados em streaming e em tempo real. O artigo busca mostrar como podemos usar o Apache Spark para realizar análises sob informações em cenários onde os dados são gerados continuamente.
-
O papel de um cientista de dados em 2016
O papel do Cientista de Dados está ganhando muita atenção ultimamente, devido ao fato das organizações começarem a utilizar Big Data e análise de dados para adquirir insights a respeito de seus dados. Este artigo apresenta uma visão sobre o papel do Cientista de Dados para o ano de 2016.
-
10 anos de Domain-Driven Design com Eric Evans
Dez anos após o lançamento do livro Domain-Driven Design: Tackling Complexity in Software. Eric Evans fala sobre o que mudaria no seu livro e como o DDD mudou a maneira de construir sistemas.
-
Big Data com Apache Spark Parte 2: Spark SQL
O Spark SQL, é parte integrante do framework de Big Data Apache Spark, utilizado para processamento de dados estruturados, que permite executar consultas SQL no conjunto de dados do Spark. É possível realizar tarefas ETL sobre os dados em diferentes formatos, como por exemplo JSON, Parquet, banco de dados e com isto, executar consultas ad-hoc.
-
Big Data com Apache Spark - Parte 1: Introdução
O Apache Spark é um framework de big data construído para ser veloz, fácil de usar e com analises sofisticadas. Nesse artigo, Srini Penchikala mostra como o Spark ajuda no processamento e analise de Big Data com sua API padrão. Também compara o Spark com a implementação tradicional de MapReduce do Apache Hadoop.
-
Um comparativo entre MapReduce e Spark para analise de Big Data
MapReduce e Spark são os dois frameworks mais populares existentes atualmente para computação em cluster e análise de dados de larga escala (Big Data). Este artigo, apresenta a avaliação dos principais componentes arquiteturais do MapReduce e do Spark incluindo: shuffle, modelo de execução e cache por meio de um conjunto de dados a serem processados.
-
Aprendizado de Máquina e Computação Cognitiva
Baseado em um webinar sobre análise de dados, este artigo compreende tópicos sobre aprendizado de máquina e computação cognitiva, e como essas áreas estão relacionadas à Inteligência Artificial. Os palestrantes discutem como estas tecnologias estão sendo aplicadas no segmento de marketing digital e quais as preocupações que as organizações possuem para prover serviços de aprendizado de máquina.
-
Múltiplos núcleos de indexação com o Apache Solr
O Apache Solr é uma plataforma de indexação e busca que permite a criação de arquiteturas de acordo com as necessidades de negócio. O Solr possui diversos recursos como faceted search, replicação de índices, criação de múltiplos cores de indexação além de busca, caching, sharding e busca geoespacial. Este artigo mostra como criar uma arquitetura de múltiplos núcleos com o Solr.