`
coderplay
  • 浏览: 571490 次
  • 性别: Icon_minigender_1
  • 来自: 广州杭州
社区版块
存档分类
最新评论

lucene2.3.2与2.2.0建索引的速度比较

阅读更多

文本材料大小: 43.9 MB
文件数目: 19997个
分析器:    lucene标准StandardAnalyzer

lucene-2.2.0
索引大小: 16,901,638 字节
耗时:
158094 total milliseconds
110437 total milliseconds
106328 total milliseconds


lucene-2.3.2
索引大小: 16,177,772字节
默认16M缓存耗时:
15407 total milliseconds
15500 total milliseconds
设置64M缓存耗时:
13578 total milliseconds
13984 total milliseconds
13359 total milliseconds
15500 total milliseconds

 

可以看出2.3比2.2建索引的速度要快5~10倍。原理请看2.2的DocumentWriter和2.3的DocumentsWriter.

2.3采用in-memory模型。

分享到:
评论
3 楼 Arbow 2008-08-04  
泡坛看到有人说已经在这上面开发中文分词了吧?
2 楼 coderplay 2008-08-03  
没有嘞,谢谢阿宝同学,哈哈~~ 这个看features貌似很牛的说。不过要用它还得改个中文分词算法适应它.
1 楼 Arbow 2008-07-30  
aol同学有没有试用过 Sphinx 的索引?据说这个项目的性能比lucene高不少

相关推荐

Global site tag (gtag.js) - Google Analytics