GAE/Java全文搜索

标签:Google App Engine

刚才在Google App Engine Blog看到一篇《Making your app searchable using self merge-joins》,里面提到了如何在GAE/J + JDO上实现全文搜索。
粗略测试了一下,发现支持中文,所以就在此推荐了。

原理很简单,就是将字符串分成很多个token,放在一个set里,然后对这个set进行索引即可。查询时也分成很多个token,进行self merge-join。
问题就是如何解析token了。这个演示用到org.apache.lucene.analysis(Lucene Java),Python也有个PyLucene接口,可惜底层还是JVM,所以不能运行在GAE/Python环境下。
此外作者还将rank功能保密了,只能自己去发掘了=。=

2条评论 你不来一发么↓ 顺序排列 倒序排列

    向下滚动可载入更多评论,或者点这里禁止自动加载

    想说点什么呢?