BT
x Por favor preencha a pesquisa do InfoQ !

Big Data da Microsoft: um panorama das novidades

por Roopesh Shenoy , traduzido por Marcelo de Castro em 19 Fev 2013 |

Alguns meses atrás, a Microsoft anunciou o HDInsight, a distribuição do Hadoop da empresa para gerenciar, analisar e dar sentido a grandes volumes de dados. A InfoQ contatou Val Fontama, Gerente de Produtos do SQL Server, para conhecer os rumos da estratégia de Big Data na Microsoft.

Quanto à evolução da quantidade de dados nas empresas, disse Fontana:

O oceano de dados empresariais não para de crescer. Algumas estimativas indicam que as informações que uma empresa armazena dobram de tamanho a cada ano. O Gartner, por exemplo, vê o volume de informação aumentando a uma taxa de 59% ao ano, com cerca de 85% desses dados sendo "desestruturados", ou seja, dados como vídeos, etiquetas RFID e logs de sites. Esses dados não-estruturados não são fáceis de tratar em sistemas de gerenciamento tradicionais. Clientes irão precisar de uma plataforma de dados que evolua com os próprios dados e a velocidade em que surgem. O Big Data permite encontrar novos conhecimentos a partir dos dados coletados, sejam eles estruturados ou não, além de orientar as decisões de forma mais inteligente a partir dos dados.

O HDInsight é a solução da Microsoft para enfrentar o desafio do Big Data?

Esperamos acelerar a adoção do Hadoop nas empresas através da oferta de distribuições Hadoop para Windows Server e Windows Azure. Isso além de aperfeiçoar a segurança do Hadoop integrando o HDInsight com o Active Directory. Isso possibilita que o setor de TI aplique politicas de segurança consistentes em todos seus recursos, incluindo clusters do Hadoop. Além disso, por meio da integração com o System Center, o HDInsight simplifica o gerenciamento do Hadoop e possibilita que o departamento de TI gerencie seus clusters Hadoop juntamente com seus bancos SQL Server e aplicações, em um único ambiente.

Para oferecer 100% de compatibilidade com o Apache Hadoop, o HDInsight, é construído sobre a Hortonworks Data Platform (HDP). Como resultado, pode-se mover jobs MapReduce de servidores Windows para a nuvem, ou até mesmo para uma distribuição do Apache Hadoop executando no Linux. Além disso, disponibilizar tais recursos nas plataformas Windows Server e Azure permite usar ferramentas familiares como Excel, PowerPivot para Excel e Power View.

Como o SQL Server se encaixa nessa solução?

Um dos diferenciais do SQL Server 2012 para o SQL Server 2008 para o processamento de grandes massas de dados é sua compatibilidade com o Hadoop. A parceria da Microsoft com a Hortonworks, bem como os previews do HDInsight Server e Windows Azure HDInsight Service, possibilitam usar conectores Hadoop, desenvolvidos pela Microsoft. Além disso, com o driver ODBC Hive que conecta o SQL Server ao Hadoop, pode-se usar as ferramentas de BI da Microsoft como o PowerPivot e o Power View no SQL Sever 2012, para analisar dados. E com o novo Data Quality Services do SQL Server 2012 é possível converter dados brutos para dados confiáveis e mais consistentes com a modelagem.

A Microsoft recentemente anunciou novos recursos do Office 2013 e formas de usá-los na construção de aplicações e no consumo de serviços de dados. A empresa faz uso dessas funcionalidades para fornecer serviços de Big Data no Excel.

O Excel é um dos principais clientes que permitem a análise de Big Data na plataforma Microsoft. No Excel 2013, nossas principais ferramentas de BI são o PowerPivot, para modelagem de dados, e o Power View, para visualização. A integração permite criar um serviço de BI usando a interface do Excel. E através do add-in Hive do Excel, nossos serviços HDInsight se integram com as ferramentas de BI do Office 2013.

Além do Excel, a Microsoft oferece ferramentas para interagir com Big Data: Profissionais de Business Intelligence podem usar o BI Developer Studio para modelar cubos OLAP ou modelos do PowerPivot no SQL Server Analysis Services. Desenvolvedores podem continuar a usar o Visual Studio para desenvolver programas de MapReduce escritos em .NET, e operadores de TI podem gerenciar clusters Hadoop no HDInsight com o System Center que usam hoje.

No geral, a estratégia da Microsoft parece ser oferecer um caminho mais rápido e de menor resistência para a adoção de Big Data, estendendo ferramentas existentes, como SQL Server e o Office, para funcionar com os novos tipos de dados, e permitindo que empresas tirem vantagens dos seus investimentos atuais.

Avalie esse artigo

Relevância
Estilo/Redação

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião
Feedback geral
Bugs
Publicidade
Editorial
Marketing
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2016 C4Media Inc.
Política de privacidade
BT

Percebemos que você está utilizando um bloqueador de propagandas

Nós entendemos porquê utilizar um bloqueador de propagandas. No entanto, nós precisamos da sua ajuda para manter o InfoQ gratuito. O InfoQ não compartilhará seus dados com nenhum terceiro sem que você autorize. Procuramos trabalhar com anúncios de empresas e produtos que sejam relevantes para nossos leitores. Por favor, considere adicionar o InfoQ como uma exceção no seu bloqueador de propagandas.