BT

Apache Lucene e Lucene.Net – Full Text Search Servers

por Jonathan Allen , traduzido por Felipe Rodrigues em 14 Nov 2008 |

Dez anos atrás, confiar em projetos de código aberto era inimaginável na maioria das lojas do Windows. atualmente, programadores .NET estão despertando para a classe de software corporativo desenvolvido e comprovado sobre a plataforma Java pelo mundo todo. Hoje olhamos para os engines de busca Full Text mais populares, Apache Lucene e Lucene.Net.

Apache Lucene e Lucene.Net são produtos consagrados utilizados para fornecer capacidades de pesquisa, para grande sites como a Wikipedia, CNET, e Monster.com. Com referências como essas, as suas capacidades e futuro não deixam dúvidas.

Lucene não é um engine de rastreamento, nem indexa o conteúdo automaticamente. O texto dos documentos a serem indexados deve ser extraído antes do carregamento em um índice Lucene. A norma padrão para fazer isso é para criar uma instância um Analyzer, abrir um IndexWriter e em seguida, adicionar os documentos um por um. Uma vez feito isso, o índice pode ser opcionalmente otimizados antes que seja fechado e a mudança confirmada. Este processo é provavelmente mais hands-on do que os desenvolvedores estão acostumados, mas lhe dá mais flexibilidade sobre quais dados são indexados.

As pesquisas podem ser feitas através de um modelo de objeto, com a consulta construída por termo. Como alternativa, uma simples string de pesquisa, talvez digitada pelo usuário final, pode ser analisado e executado. Desenvolvedores .NET usando .NET 3.5 ou posterior têm também uma terceira opção, LINQ para Lucene . A página do projeto mostra o mapeamento entre a sintaxe de pesquisa do Lucene e a sintaxe LINQ para Lucene correspondente.

Se você quiser testar, o Andrew Smith tem um artigo de Introdução ao Lucene.NET . E independente de você escolher a versão .NET ou Java, também dê uma olhada noartigo do Erik Hatcher, Lucene Intro .

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber menssagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber menssagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber menssagens dessa discussão

Dê sua opinião

Conteúdo educacional

Feedback geral
Bugs
Publicidade
Editorial
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2013 C4Media Inc.
Política de privacidade
BT