首先介绍LUCENE,LUCENE是基于Java的全文索引/检索引擎。
Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。
Lucene的相关介绍就先不说了,在网上大家可以找到一大把,它的单独建立索引和查询在之前有一篇文章已经写过了,有举大家可以看看,现在主要介绍一下SOLR方面的东西,和SOLR的搭建和在项目中的应运。
SOLR服务器的搭建,建议下载SOLR的 solr-1.4-paoding.zip,在网上可以找到,在这个版本里带有PAODING分词的,可以为需要分词的同行们省不少事,也省不少时间。(其中在WEB-INF\classes下会自动生成一个DIC文件夹是PAODING分词用的,这个保留就可以了)
部署服务,将刚才的包时的war文件COPY到你的WEB服务器的WEBAPPS下,如TOMCAT或是RESIN下的WEBAPPS下,当然可以重命名为你自己想要的名称或是项目名称,在WEB-INF下的web.xml中做修改就可以了,修改内容如下:
接下来设置SOLR-HOME:同样在web.xml中添加内容:
在此指定SOLRHOME。
上面建立了SOLRHOME,那里所当然就要有相应的目录和文件了,
如上所指向的,在d:/solrtest/下建立solr文件夹,同理在其下建立conf、lib.
conf下放SOLR的默认一些配置文件,如:schema.xml、solrconfig.xml等等,还有一些其它的,我们直接考过去就可以了,除了这两个文件需要我们修改以外其余的都不用做任何修改,具体修改内容如下:
schema.xml:
fieldType 的添加,是为下面的字段设置类型,
其中:
这段可对下面设置的字段进行分词,用的就是刚才上面提到的PAODING分词,就只需要这么设置就可以了,不用在做其它任何设置。
在字段中这样设置就可以成功分词了:
solrconfig.xml 的配置:
OK,大功告成,重启服务器试着访问一下,看看能不能成功:
http://localhost:8080/yourprojectName
这样一个SOLR索引服务器就配置成功了,其中还包括了PAODING分词,不错吧!
当然这只是简单的开始,SOLR和LUCENE的东西还多着呢,有专门的架构还有好多相关的东西要学习,我们一起努力吧。
由于本人对架构方面比较感兴趣,希望有兴趣的或是高手可以指点指点。
最新评论