BT

Apache Solr 4.5: suporte a dados distribuídos customizável e Faceted Multithread

por Marcelo Costa em 16 Out 2013 |

 

Solr é uma plataforma de busca NoSQL fornecida em código livre que faz parte do projeto Apache Lucene. Suas principais características incluem pesquisa completa em textos estruturados e não estruturados, destaques das informações em formato highlighting, exibição de resultados de uma busca no formato faceted, integração com banco de dados, analise em documentos ricos como, por exemplo: DOC, XLS, PDF e MP3, além de permitir a realização de buscas geoespaciais.

Solr tornou-se uma plataforma popular para sites web devido a sua capacidade de indexar e fazer buscas em muitas fontes ao mesmo tempo retornando recomendações para conteúdo baseado na taxonomia da busca. É utilizado por muitas empresas por permitir a indexação de documentos anexados em emails por exemplo.

Solr trabalha com HTTP e XML e oferece APIs pata várias linguagens de programação como, por exemplo: JSON, Python, Ruby e .NET.

No inicio de outubro a versão 4.5 foi lançada e traz entre novos recursos, a possibilidade de fazer consultas em dados distribuídos (sharding) de forma customizável inclusive por campo, faceted em formato multithread, a classe CloudSolrServer é capaz de endereçar diretamente o nó líder no cenário com dados distribuídos provendo tolerância a falhas para os dados e seus índices. Entre os principais destaques desta nova versão estão:

  • Suporte customizado para dados distribuídos (sharding) incluindo a habilidade de realizar a distribuição de dados por campo;
  • Melhorias no campo DocValue que agora não necessita mais de um valor padrão e permite que campos do tipo dynamicFields aceite os tipos Doc. Essas melhorias também permitem que a configuração dos valores dos atributos sortMissingFirst e sortMissingLast sejam interpretados durante a busca para os tipos DocValue;
  • Possibilidade de armazenar o arquivo solr.xml no servidor Apache ZooKeeper;
  • A classe CloudSolrServer agora permite que as atualizações de rotas sejam realizadas diretamente para o nó líder no cenário distribuído.

Solr 4.5 possui muitas outras funcionalidades assim como várias correções de bugs e melhorias de desempenho. Conheça mais sobre o projeto Apache Solr em seu wiki.

Avalie esse artigo

Relevância
Estilo/Redação

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião
Feedback geral
Bugs
Publicidade
Editorial
Marketing
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2016 C4Media Inc.
Política de privacidade
BT

We notice you’re using an ad blocker

We understand why you use ad blockers. However to keep InfoQ free we need your support. InfoQ will not provide your data to third parties without individual opt-in consent. We only work with advertisers relevant to our readers. Please consider whitelisting us.