BT

Início Notícias Snowflake anuncia Warehouse na nuvem disponível para clientes em geral

Snowflake anuncia Warehouse na nuvem disponível para clientes em geral

Favoritos

A Snowflake Computing anunciou que o Snowflake Elastic Data Warehouse, um software como serviço que disponibiliza um data warehouse SQL baseado no Amazon Web Services, está disponível para clientes em geral.

Em um post de Outubro de 2014, Curt Monash explica que o serviço "foi construído do zero (ao invés de, por exemplo, ser baseado em PostgreSQL ou Hadoop)" e "é colunar e apenas incremental, conforme o que é comum para SGBDR (Sistemas de Gerenciamento de Bancos de Dados Relacionais)". "Dados são armazenados em arquivos comprimidos de 16 megabytes no S3 da Amazon, e alocados em servidores EC2, também na Amazon, para execução de consultas de acordo com a demanda". Adicionalmente, ainda que o "Snowflake não tenha indexes… tem um sistema de zoneamento, mais conhecido como data skiping" que permite que arquivos sejam excluídos caso não sejam necessário para execução de uma consulta.

Os diferenciais do Snowflake vem de três características base do sistema. Primeiramente, o Snowflake é SaaS com gerenciamento integral o que reduz as demandas operacionais para quase zero. Enquanto serviços como o Redshift da Amazon reduziram drasticamente o trabalho de criação de um data warehouse, ainda existe a necessidade operacional de gerenciamento e ajuste de escala do Redshit periodicamente.

Em segundo lugar o Snowflake foi feito para suportar a combinação de dados estruturados e semi-estruturados. Ele pode, por exemplo, receber dados em formato JSON, XML ou Avro, sendo que todos estes suportam aninhamento e repetição de tipos de dados. Essa característica, permite que o Snowflake vá além dos casos de uso de um data warehouse típico se alinhando ao que faz o Hadoop, bem como atendendo a outros casos de uso envolvendo dados semi-estruturados.

Por fim, a elasticidade do serviço, permite um modelo de preço interessante e novo no mercado de data warehouse. O preço é baseado na quantidade de dados armazenados e no tempo de computação utilizado. Se o processamento de dados não for necessário (por exemplo, no período noturno) é possível simplesmente reduzir a escala da infraestrutura responsável pelo processamento e aumentar os recursos quando for necessário. O Redshift tem uma funcionalidade similar, usando um mecanismo de criação e restauração de snapshots, mas a restauração pode precisar de um tempo significativo devida a necessidade de realizar a cópia de dados para os servidores Redshift. Diferentemente, o Snowflake sobe mais rápido já que a cópia dos dados para seus servidores é feita sob demanda.

Em um segundo anúncio, a Snowflake informou ter angariado U$45.000.000,00 junto a Altimeter Capital, Redpoint Ventures, Sutter Hill Ventures e Wing Ventures. Esse valor é adicional ao captado anteriormente em Outubro de 2014, quando foram angariados U$26.000.000,00 junto a Redpoint Ventures, Sutter Hill Ventures e Wing Ventures.

Avalie esse artigo

Relevância
Estilo/Redação

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

BT

Seu cadastro no InfoQ está atualizado? Poderia rever suas informações?

Nota: se você alterar seu email, receberá uma mensagem de confirmação

Nome da empresa:
Cargo/papel na empresa:
Tamanho da empresa:
País:
Estado:
Você vai receber um email para validação do novo endereço. Esta janela pop-up fechará em instantes.