目前个人打算用于 electron 做的知识管理软件的文章搜索。
主要基于
1. rocksDB
2. roaring(bitmap)
3. jiebanode(分词)
4. rxjs
https://github.com/yuankui/loosenjs(Lucene 谐音,我是不是很无耻。。)
目前还在开发中,但是架子基本完成。
1. 支持全文搜索
2. 支持整数的过滤,排序
3. 高度可扩展(有兴趣自己看代码)
在开发之前,我也调研过其他的库。比如
lunr:大致看了下,他好像全是基于内存的,序列化保存到磁盘的成本有点?相比之下,loosenjs 是基于 rocksdb,磁盘+内存,支持增量更新。
不知道大家有兴趣,如果有兴趣,我后面可以准备写一个系列文章,来介绍下原理和该库的正确打开方式。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://study.congcong.us/t/662029
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.