BT
rss
  • Big Data com Apache Spark Parte 2: Spark SQL

    por Srini Penchikala , traduzido por Marcelo Costa   em  13 Abr, 2016

    O Spark SQL, é parte integrante do framework de Big Data Apache Spark, utilizado para processamento de dados estruturados, que permite executar consultas SQL no conjunto de dados do Spark. É possível realizar tarefas ETL sobre os dados em diferentes formatos, como por exemplo JSON, Parquet, banco de dados e com isto, executar consultas ad-hoc.

  • Big Data com Apache Spark - Parte 1: Introdução

    por Srini Penchikala , traduzido por Luiz Santana   em  14 Nov, 2015 1

    O Apache Spark é um framework de big data construído para ser veloz, fácil de usar e com analises sofisticadas. Nesse artigo, Srini Penchikala mostra como o Spark ajuda no processamento e analise de Big Data com sua API padrão. Também compara o Spark com a implementação tradicional de MapReduce do Apache Hadoop.

  • Um comparativo entre MapReduce e Spark para analise de Big Data

    por Marcelo Costa em  09 Nov, 2015

    MapReduce e Spark são os dois frameworks mais populares existentes atualmente para computação em cluster e análise de dados de larga escala (Big Data). Este artigo, apresenta a avaliação dos principais componentes arquiteturais do MapReduce e do Spark incluindo: shuffle, modelo de execução e cache por meio de um conjunto de dados a serem processados.

Aprendizado de Máquina e Computação Cognitiva

Postado por Seth Earley , traduzido por Cassiano Faria   em  04 Nov, 2015

Baseado em um webinar sobre análise de dados, este artigo compreende tópicos sobre aprendizado de máquina e computação cognitiva, e como essas áreas estão relacionadas à Inteligência Artificial (IA). 1

Hadoop na nuvem

Postado por Mathieu Despriee , traduzido por Sergio Fernandes   em  22 Mai, 2014

Os provedores de soluções Hadoop em ambientes de nuvem evoluíram. Há diversos fornecedores provendo variadas soluções em nuvem. Este artigo, apresenta uma análise deste novo panorama. 1

O estado do NoSQL

Postado por Stefan Edlich , traduzido por André Campanini   em  21 Nov, 2013

Stefan Edlich analisa o NoSQL, considerando sua evolução, impacto financeiro, padrões ou a falta deles, cenário atual, livros, os líderes e alguns recém-chegados, concluindo que NoSQL veio para ficar.

PostgreSQL: Armazenamento de dados em formato "schemaless"

Postado por Marcelo Costa em  22 Out, 2013

Schemaless permite armazenar dados sem conhecimento prévio de chaves ou tipos de dados. Este artigo apresenta uma solução utilizando PostgreSQL para armazenar dados em formato schemaless com Hstore. 1

Feedback geral
Bugs
Publicidade
Editorial
Marketing
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2016 C4Media Inc.
Política de privacidade
BT