V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
paulguo
V2EX  ›  问与答

求一个帖子推荐算法(根据帖子支持和帖子不支持的人数以及帖子创建时间)

  •  
  •   paulguo · Sep 7, 2012 · 3488 views
    This topic created in 4979 days ago, the information mentioned may be changed or developed.
    比如数据库中存有如下三个字段:

    ----------------------------------------
    | id | support | unsupport | timestamp |
    ----------------------------------------
    | 1 | 45 | 19 | 14223xxxxx|
    ----------------------------------------

    根据这三个字段,如何才是比较好的自动推荐?
    7 replies    1970-01-01 08:00:00 +08:00
    hu437
        1
    hu437  
       Sep 7, 2012
    如果只根据这个基本上没有太好的,现在的推荐主要有两种,协同过滤和内容相似度;内容相似度可以使用TD IDF,你这个比较适合使用协同过滤中的基于用户的协同过滤。
    比如用户A,支持了帖子1、2、3
    用户B,支持了帖子,1
    用户C,支持了帖子,1、3
    那就可以为用户C推荐帖子2
    hu437
        2
    hu437  
       Sep 7, 2012
    可以使用TD IDF和上面的这个协同过滤结合的方法
    Js
        3
    Js  
       Sep 7, 2012
    这几个字段只能(support-unsupport)/(now()-timestamp)*N因子吧

    阮一峰今年年初写过几篇《基于用户投票的排名算法》的
    paulguo
        4
    paulguo  
    OP
       Sep 7, 2012
    @hu437 @Js thx, 我没表述清楚,不能算是推荐,其实是为了生成一个HOT LIST。我参考下Js的算法,跟前几天看的讲Digg算法的一文中提及的算法类似。
    best1a
        5
    best1a  
       Sep 7, 2012
    要不参考下Reddit的?
    http://songshuhui.net/archives/66981
    leiz
        7
    leiz  
       Sep 7, 2012
    你要的是一个排序优先的取舍吧。
    先排s+us总数,然后排时间,例如一周内,最后排s
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3571 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 95ms · UTC 00:05 · PVG 08:05 · LAX 17:05 · JFK 20:05
    ♥ Do have faith in what you're doing.