用 LDA 主题模型, 给拨云搜索加上了相近小说查询

2018 年 2 月 25 日
 enenaaa

做法是先用 LDA 把小说文本降维, 每个文本 400 个主题。然后用余弦相似度进行匹配。

体验地址: https://www.boyunso.com/similar/28285

3287 次点击
所在节点    分享创造
6 条回复
chaoil
2018 年 2 月 25 日
标签对搜索的影响结果很大啊,搜索盗墓笔记会出现很多无关的结果
JohnChiu
2018 年 2 月 25 日
感觉带的标签有点问题,搜索斗破苍穹,出现的都是带斗破标签的都市言情小说~
enenaaa
2018 年 2 月 25 日
@chaoil
@JohnChiu
我上面没说清楚。搜索是按小说标签检索的。 相近小说是在详情页里的“更多类似小说”链接。

比如 斗破苍穹 的相近小说页面是:
https://www.boyunso.com/similar/292
freedot
2018 年 2 月 27 日
啥是“真抓实干”😳
enenaaa
2018 年 2 月 28 日
@freedot 顾名思义尔
shidenggui
2019 年 10 月 22 日
楼主还在吗?想交换下友链,拨云搜索的邮箱联系不上,我的网站是 https://www.tuishujun.com

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/432428

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX