BT

Apache Lucene e Lucene.Net – Full Text Search Servers

por Jonathan Allen , traduzido por Felipe Rodrigues em 14 Nov 2008 |

Dez anos atrás, confiar em projetos de código aberto era inimaginável na maioria das lojas do Windows. atualmente, programadores .NET estão despertando para a classe de software corporativo desenvolvido e comprovado sobre a plataforma Java pelo mundo todo. Hoje olhamos para os engines de busca Full Text mais populares, Apache Lucene e Lucene.Net.

Apache Lucene e Lucene.Net são produtos consagrados utilizados para fornecer capacidades de pesquisa, para grande sites como a Wikipedia, CNET, e Monster.com. Com referências como essas, as suas capacidades e futuro não deixam dúvidas.

Lucene não é um engine de rastreamento, nem indexa o conteúdo automaticamente. O texto dos documentos a serem indexados deve ser extraído antes do carregamento em um índice Lucene. A norma padrão para fazer isso é para criar uma instância um Analyzer, abrir um IndexWriter e em seguida, adicionar os documentos um por um. Uma vez feito isso, o índice pode ser opcionalmente otimizados antes que seja fechado e a mudança confirmada. Este processo é provavelmente mais hands-on do que os desenvolvedores estão acostumados, mas lhe dá mais flexibilidade sobre quais dados são indexados.

As pesquisas podem ser feitas através de um modelo de objeto, com a consulta construída por termo. Como alternativa, uma simples string de pesquisa, talvez digitada pelo usuário final, pode ser analisado e executado. Desenvolvedores .NET usando .NET 3.5 ou posterior têm também uma terceira opção, LINQ para Lucene . A página do projeto mostra o mapeamento entre a sintaxe de pesquisa do Lucene e a sintaxe LINQ para Lucene correspondente.

Se você quiser testar, o Andrew Smith tem um artigo de Introdução ao Lucene.NET . E independente de você escolher a versão .NET ou Java, também dê uma olhada noartigo do Erik Hatcher, Lucene Intro .

Avalie esse artigo

Relevância
Estilo/Redação

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião
Feedback geral
Bugs
Publicidade
Editorial
Marketing
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2016 C4Media Inc.
Política de privacidade
BT

We notice you’re using an ad blocker

We understand why you use ad blockers. However to keep InfoQ free we need your support. InfoQ will not provide your data to third parties without individual opt-in consent. We only work with advertisers relevant to our readers. Please consider whitelisting us.