BT

Lucene.Net elevado ao primeiro time da Apache: paridade com Java e novas perspectivas

por Abel Avram , traduzido por Thiago Galbiatti Vespa em 31 Ago 2012 |

O Lucene.Net, a implementação em C# do Lucene, a popular biblioteca para indexação e pesquisa de textos, graduou-se na incubadora do Apache e se tornou um projeto de nível superior.

O Lucene.Net é uma versão fiel do Lucene em Java. Iniciou como um projeto na incubadora da Apache em 2006, mas teve seu desenvolvimento interrompido em um determinado ponto, especialmente em 2010, quando o SVN recebeu poucos commits. O projeto foi revigorado em 2011, e as versões 2.9.2, 2.9.4 e 2.8.4g foram lançadas.

A graduação do Lucene.Net é um reconhecimento pela Apache que o projeto está ativo e que o conselho da organização está confiante de que trata-se de um projeto sólido.

A equipe do Lucene.Net está se preparando para lançar a versão 3.0.3 em breve; cada versão está sendo lançada paralelamente às versões correspondentes em Java do Lucene, de acordo com Prescott Nasser, committer do projeto, entrevistado pelo InfoQ:

A versão 3.0.3 terá paridade de recursos com a versão 3.0.3 do Lucene em Java. Há uma relação entre os projetos, e os nossos números de versão coincidem com os deles. Porém, os pacotes Lucene.Net.Contrib provavelmente não terão paridade de recursos, pois temos uma comunidade menor e manter estes pacotes atualizados é mais difícil

Atualmente, a equipe tem duas versões para o .NET, uma delas inclui suporte para tipos genéricos, mas isso provavelmente irá mudar no futuro:

Falamos muito sobre como fazer a API de acordo com as convenções do .NET (em vez das convenções do Java). O branch com suporte a tipos genéricos (2.9.4g) já utiliza muito mais dessas convenções do que a versão 2.9.4. Acredito que primeiro tentaremos alcançar a mesma velocidade do Lucene para Java, e que na sequência nos concentraremos em aproximá-lo mais do estilo .Net. As duas frentes provavelmente irão convergir; ou o branch 2.9.4g pode morrer prematuramente e o trunk incorpore estes recursos.

O planejamento do projeto apresenta a intenção de recuperar-se do atraso em relação ao Lucene Java, mas não há um prazo limite, como reconhece Nasser: "Temos um roteiro ainda incipiente, sem nenhum cronograma. Na sequência, temos agendada a versão 3.6, e a nossa esperança é que possamos chegar à versão 4.0 sem muita demora."

Quanto à oportunidade de se ter um projeto Solr.Net, Nasser comenta:

Temos discutido sobre o Solr.NET, mas a realidade é que não possuímos os recursos para realizá-lo. Reconhecemos os benefícios e sabemos que há demanda na nossa comunidade. Também gostaríamos de ter algo parecido com o projeto tiki para .NET.

Nesse meio tempo, a Apache anunciou o Lucene e Solr 4.0 Beta para Java, com novas funcionalidades: arquitetura plugável de Codecs, pontuação (score) flexível, APIs de Document Values e de Fields, otimizações e outras funcionalidades, como descrito mais detalhadamente no post de Mike McCandless, um commiter do projeto Lucene e membro do PMC do projeto.

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião

Conteúdo educacional

Feedback geral
Bugs
Publicidade
Editorial
InfoQ Brasil e todo o seu conteúdo: todos os direitos reservados. © 2006-2014 C4Media Inc.
Política de privacidade
BT