Luke是一个便捷的索引查询和诊断工具,可以访问Lucene构建的索引文件,查询lucene索引文件的专用工具!能显示和修改lucene建好的索引文件的内容。可以查询特定Field的索引,也能看出现次数前多少位的Item,是研究lucene必须具备的工具!
Luke功能:
通过document编号或term浏览索引
查询document内容,可复制到剪贴板对频率最高的term的索引字段提供排名后的浏览
实行搜索语句并浏览搜索结果剖析搜索结果
从索引中选择性删除文件重建原始文档字段,对其进行编辑,然后重新插入的索引
优化索引环境需要:
Luke是java语音写的开源软件,需要安装JRE1.6以上java环境支持。
lucene 索引查询工具如何使用?
启动后选择你的索引文件路径,选择read|only打开:
overview界面是用来进行索引的一般性查询和操作的,譬如索引目录,域信息,版本,term信息,Rank排名等信息。注意,索引文件里Analyze却不Store的字段信息还是不可见的,也就是只能看STORE了的内容。
documents界面是用来进行文档的操作和查询的,能依据文档编号和词进行查找,其实这个就是搜索功能。
search界面是可以进行索引的搜索测试,可以撰写lucene搜索语句,看到语句分析后的query树,还可以选择进行搜索的分词器、默认字段和重复搜索次数,然后下面的listview中就会列出一个搜索的的文档的所有保存的(store)字段的值,可以看到查看花费的时间
file界面,故名思义,这个就是用来查询每一个索引有关文件的一些属性的界面,具体的话,可以通过这个界面剖析下索引文件的多少,是不是需要优化或者合并等等
最后一个plugins界面,就是可以看到luke提供的各种插件。比较有用的还是分词工具,提供一个分词的类,然后下面文本框输入一段文本,然后就能让这个工具助你分词,你可以看到详细的分词信息,对自概念分词器的调试或者测试。还有一个hadoop插件,支持从hadoop节点中获得节点中文件的有关信息,对分布式搜索引擎搭建有用,算是支持多平台的lucene索引文件块的查询。
个人理解Lucene
其实Lucene构建的索引,无论从结构上说还是功能上说,和一个DBMS数据库很像,你可以觉得Luke做的事情就是包装了Lucene的IndexReader和IndexSearcher之后,变成一个界面化的索引展示和管理工具。你完全可以自己写程序在cmd里查询,但没Luke提供的展示那样直观和多样。
TAG标签:lucene(1)
转载请说明来源于谷普下载站(https://www.muerya.com)
本文地址:https://www.muerya.com/soft/14228.html
郑重声明:文章来源于网络作为参考,本站仅用于分享不存储任何下载资源,如果网站中图片和文字侵犯了您的版权,请联系我们处理!邮箱3450399331@qq.com