小红书软文(广) 自动识别检测插件

1 月 20 日
 nziyouren
最近新家装修看电器,刷小红书比较频繁,感觉现在小红书的软广有点多,想找点电器类真实用户评价不太好找。想做个浏览器插件可以自动或者手动检测软文或者软广。大佬们觉得这个想法真实可行吗?不知道是不是伪需求?
1811 次点击
所在节点    奇思妙想
11 条回复
renmu
1 月 20 日
90%都是软文,还有 100%避雷,用不着识别
OBNtHBZY3N3lxGVT
1 月 20 日
老哥如果在京东有看得上家电,可以找我报价,价格可以接近国补
mokeyjay
1 月 20 日
想法是好的,但你检测软文的依据是什么?可信度如何?
如果这有人能把这玩意儿做到切实可用,那肯定是各大互联网厂商抢着要的人才
nziyouren
1 月 20 日
@OBNtHBZY3N3lxGVT 谢谢老哥 有需要就找~
nziyouren
1 月 20 日
@renmu 这么惨。小红书感觉现在越来越不行了,前几年那个时候基本都是真实的分享啥的
nziyouren
1 月 20 日
@mokeyjay 我没想那么大,还没想那么多。哈哈。就是想初步规则识别下加上 AI ? AI 我就用第三方 豆包或者 deepseek 那种
Chicagoake
1 月 20 日
说实话不好检测,类型众多,软文很难辨别。b 站推广那个插件由用户判断上传共享的挺好的,不过小红书笔记量太大,检测不了。
my101du
1 月 20 日
很有搞头。给你提供几个关键词,做出来给我一个试用码就好,哈哈。

标题有“避雷”的,十个有八个是家具/甲醛/美容广告,本身就是雷。
标题有“谁懂”的,100%是化妆品/女士内衣广告
标题有“发生了什么?/听说了吗?” 屁大的事神神秘秘,肯定是引流的。
标题看起来文案“孤单寂寞冷”的意思的的,基本上是擦边的。
标题咋咋呼呼世界大乱的,基本上是乱扯的键盘侠。
标题要养生,似乎不注意健康就要死了的,基本上是卖保险的。
看到 “趣” “玩” “极” “科” “潮” “研究” “哥” “姐” “观察” “叔” “评” “码” “爸” “妈” “宝” “育儿” “读书” “天下” “纵横” 的博主,赶紧拉黑,绝大部分都是 AI 假人,AI 内容, 为了避免被波及,微信公众号关注极客湾/差评/笔吧等几个 就可以了。


————————
这么搞完一轮,最后发现你只能看到做菜和二次元的内容了。
离卸载小红书也不远了。
再重新养号,看能不能再次出现你感兴趣的瑜伽裤和吊带内衣吧
pillarho
1 月 20 日
老哥,这个要付费上线吗?会有合规风险吗?
nziyouren
1 月 20 日
@my101du 哈哈 你这个标题规则总结的很好啊,我随便看了一些帖子,还真跟你说的是一样的。牛
nziyouren
1 月 20 日
@pillarho 初期没想到收费啥的,就是不知道 AI 平台一天免费几百万的 token 能应付多少。我就是想先试试看,把需求稍微验证下再进行,伪需求就没必要继续下去了,最多做出来给我自己用。我大概找 AI 问了下,如果你涉及到爬小红书的内容,那肯定是不合规的,当然你用户量小,别人也不会来找你。我预期的产品形态大概这样:用户点击某个帖子的时候,如果帖子停留超过 2S ,说明在看当前页,这个时候我就把当前页的内容做个检测,如果是软文,就在展开页面加个红色角标提醒啥的,用户就没必要继续往下看了。所以我不爬它网站的任何其他内容就只看用户打开的当前页,而且只抓取当前看的页面,这样就没有风险

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1187103

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX