需要对一些数据进行去掉重复处理,规则类似于,两条记录的名称和地址相似度很大,则认为是同样的,应该去掉当中的某一个。昨天晚上翻了lucene得书籍,想找找看有什么好的方法没有,最后决定尝试一下fuzzyquery,大早上的就写了一个,结果很让我莫名其妙! 代码如下: public class FuzzyQueryTest { public static void main(String[] args) { RAMDirectory directory = new RAMDirectory(); try { IndexWriter indexW ...
lang
搜索本博客
博客分类
最近加入圈子
存档
最新评论