BT

Big Data: Distinguindo entre exagero e realidade

por Abel Avram , traduzido por Eder Ignatowicz em 08 Nov 2012 |

Uma recente pesquisa da IBM buscou distinguir o que é exagero e o que é realidade em relação a Big Data. Entre outros resultados, os dados apontam que 28% das empresas iniciaram um projeto ou implementação de piloto de Big Data, 47% planejam iniciativas desse tipo e 24% buscam conhecer mais sobre Big Data.

O relatório Estudo Analítico de 2012: iso de Big Data no mundo real (o acesso exige registro) baseou-se na pesquisa Big Data @ Work conduzida pela IBM em 2012. Foram consultados 1.144 profissionais de 95 países e 26 indústrias.

O relatório define Big Data por meio de quatro dimensões "V":

  • Volume: a característica mais comumente associada a Big Data. Mais que 50% dos pesquisados consideram que qualquer coisa entre 1 Terabyte e 1 Petabyte representa Big Data, bem menos que o volume geralmente mencionado, de vários Petabytes até Zetabytes.
  • Variedade: O Big Data abrange um amplo espectro de dados, estruturados, semi-estruturados até não estruturados, de dentro e de fora das organizações. Esses dados também podem ser de tipos variados: textos, binários, dados de sensores, tweets, dados da web, cliques, logs, áudio, vídeo etc.
  • Velocidade: dados hoje são gerados numa velocidade nunca antes vista, tornando mais difícil o seu processamento em tempo real.
  • Veracidade: o relatório adiciona essa quarta dimensão para caracterizar a confiabilidade nos dados. Fatores internos e externos podem influenciar a qualidade dos dados e portanto os resultados da análise destes.

Veja mais resultados da pesquisa:

  • 49% dos Projetos Big Data são focados no cliente, 18% têm como objetivo otimização das operações, 15% focam em gerenciamento de risco ou financeiro, 14% na criação de novos modelos de negócio, e 4% na colaboração entre funcionários.
  • As iniciativas de Big Data geralmente iniciam com dados internos estruturados; em seguida evoluem e passam a lidar com dados semi-estruturados, e finalmente alcançam dados não estruturados.

O gráfico abaixo retrata os principais componentes utilizados pelas empresas que implementaram as iniciativas de Big Data.

Curiosamente, projetos de Big Data não são provenientes essencialmente das mídias sociais, de sensores RFID ou de hardware, mas sim por Transações (88%), Dados de Log (73%), Eventos (59%), Emails (57%). Em seguida, vêm as Mídias Sociais (43%), Sensores (42%), Feeds Externos (42%), RFID ou Pontos de Venda (41%), Textos (41%), Dados Geoespaciais (40%) Áudio (38%), Imagens e Vídeos - 34%.

Empresas com iniciativas de Big Data relatam possuir as seguintes características disponíveis em suas organizações: Consultas e Relatórios - 91%, Data Mining - 77%, Visualização de Dados - 71%, Modelos Preditivos - 67%, Otimizações - 65%, Simulações - 56%, Textos em linguagem natural - 52%, Análise Geoespacial - 43%, Análise de Streaming - 35%, Análise de Vídeo - 26% e Análise de Voz - 25%.

Os participantes selecionados para a pesquisa online vêm de todos os continentes. A maioria é de profissionais de negócio (54%), fatia composta de Gerentes Executivos (16%), Marketing (15%), Pesquisa e Desenvolvimento de Produtos (10%), Gerentes de Operações (8%) e Finanças (5%). Uma boa parcela dos pesquisados (46%) é composta de profissionais de TI.

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião

Conteúdo educacional

Feedback geral
Bugs
Publicidade
Editorial
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2014 C4Media Inc.
Política de privacidade
BT