BT

Apache Solr 4.5: suporte a dados distribuídos customizável e Faceted Multithread

por Marcelo Costa em 16 Out 2013 |

 

Solr é uma plataforma de busca NoSQL fornecida em código livre que faz parte do projeto Apache Lucene. Suas principais características incluem pesquisa completa em textos estruturados e não estruturados, destaques das informações em formato highlighting, exibição de resultados de uma busca no formato faceted, integração com banco de dados, analise em documentos ricos como, por exemplo: DOC, XLS, PDF e MP3, além de permitir a realização de buscas geoespaciais.

Solr tornou-se uma plataforma popular para sites web devido a sua capacidade de indexar e fazer buscas em muitas fontes ao mesmo tempo retornando recomendações para conteúdo baseado na taxonomia da busca. É utilizado por muitas empresas por permitir a indexação de documentos anexados em emails por exemplo.

Solr trabalha com HTTP e XML e oferece APIs pata várias linguagens de programação como, por exemplo: JSON, Python, Ruby e .NET.

No inicio de outubro a versão 4.5 foi lançada e traz entre novos recursos, a possibilidade de fazer consultas em dados distribuídos (sharding) de forma customizável inclusive por campo, faceted em formato multithread, a classe CloudSolrServer é capaz de endereçar diretamente o nó líder no cenário com dados distribuídos provendo tolerância a falhas para os dados e seus índices. Entre os principais destaques desta nova versão estão:

  • Suporte customizado para dados distribuídos (sharding) incluindo a habilidade de realizar a distribuição de dados por campo;
  • Melhorias no campo DocValue que agora não necessita mais de um valor padrão e permite que campos do tipo dynamicFields aceite os tipos Doc. Essas melhorias também permitem que a configuração dos valores dos atributos sortMissingFirst e sortMissingLast sejam interpretados durante a busca para os tipos DocValue;
  • Possibilidade de armazenar o arquivo solr.xml no servidor Apache ZooKeeper;
  • A classe CloudSolrServer agora permite que as atualizações de rotas sejam realizadas diretamente para o nó líder no cenário distribuído.

Solr 4.5 possui muitas outras funcionalidades assim como várias correções de bugs e melhorias de desempenho. Conheça mais sobre o projeto Apache Solr em seu wiki.

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião

Conteúdo educacional

Feedback geral
Bugs
Publicidade
Editorial
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2014 C4Media Inc.
Política de privacidade
BT