solr查询语法,终于稿定SOLR和LUCENE了

今天终于把SOLR 和LUCENE的索引系统和后台程序整完了,也整明白了,在这里把我的学习经验写下来,分享给大家,希望对初学者有所帮助,要是有高手看到,也希望可以提些意见,看我在学习中有哪些不足,在此先谢谢了!

首先介绍LUCENE,LUCENE是基于Java的全文索引/检索引擎。

        Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。

Lucene的相关介绍就先不说了,在网上大家可以找到一大把,它的单独建立索引和查询在之前有一篇文章已经写过了,有举大家可以看看,现在主要介绍一下SOLR方面的东西,和SOLR的搭建和在项目中的应运。

        SOLR服务器的搭建,建议下载SOLR的 solr-1.4-paoding.zip,在网上可以找到,在这个版本里带有PAODING分词的,可以为需要分词的同行们省不少事,也省不少时间。(其中在WEB-INF\classes下会自动生成一个DIC文件夹是PAODING分词用的,这个保留就可以了)

         部署服务,将刚才的包时的war文件COPY到你的WEB服务器的WEBAPPS下,如TOMCAT或是RESIN下的WEBAPPS下,当然可以重命名为你自己想要的名称或是项目名称,在WEB-INF下的web.xml中做修改就可以了,修改内容如下:

   同时指定编码格式为UTF-8。

接下来设置SOLR-HOME:同样在web.xml中添加内容:

   ‍
       solr/home
       d:/solrtest/solr
       java.lang.String
   


在此指定SOLRHOME。

上面建立了SOLRHOME,那里所当然就要有相应的目录和文件了,

如上所指向的,在d:/solrtest/下建立solr文件夹,同理在其下建立conf、lib.

conf下放SOLR的默认一些配置文件,如:‍schema.xml、solrconfig.xml等等,还有一些其它的,我们直接考过去就可以了,除了这两个文件需要我们修改以外其余的都不用做任何修改,具体修改内容如下:

‍schema.xml:

fieldType 的添加,是为下面的字段设置类型,

其中:的设置 为类型的设置


     
       
       
       
       
       
     

     
       
       
       
       
       
       
     

   


这段可对下面设置的字段进行分词,用的就是刚才上面提到的PAODING分词,就只需要这么设置就可以了,不用在做其它任何设置。

   的设置为字段的设置。

在字段中这样设置就可以成功分词了:



sina_uid   #唯一键值

id    #按哪个字段搜索

     #默认搜索运算符

solrconfig.xml 的配置:

d:/solrtest/index/data    #索引文件生成的目录,生成的索引文件就会在此了。

aaa    #默认和搜索字段 搜索aaa

OK,大功告成,重启服务器试着访问一下,看看能不能成功:

http://localhost:8080/yourprojectName

这样一个SOLR索引服务器就配置成功了,其中还包括了PAODING分词,不错吧!

当然这只是简单的开始,SOLR和LUCENE的东西还多着呢,有专门的架构还有好多相关的东西要学习,我们一起努力吧。

由于本人对架构方面比较感兴趣,希望有兴趣的或是高手可以指点指点。

Tags:  solr配置 solr数据库 solr查询语法

延伸阅读

最新评论

发表评论