GAE/Java全文搜索
2010 4 27 10:48 AM 2438次查看
分类:Google App Engine 标签:Google App Engine
粗略测试了一下,发现支持中文,所以就在此推荐了。
原理很简单,就是将字符串分成很多个token,放在一个set里,然后对这个set进行索引即可。查询时也分成很多个token,进行self merge-join。
问题就是如何解析token了。这个演示用到org.apache.lucene.analysis(Lucene Java),Python也有个PyLucene接口,可惜底层还是JVM,所以不能运行在GAE/Python环境下。
此外作者还将rank功能保密了,只能自己去发掘了=。=
向下滚动可载入更多评论,或者点这里禁止自动加载。