V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
break
V2EX  ›  算法

大家采用什么样的算法来提高搜索的精准度与近期热门的综合排序质量?

  •  1
     
  •   break · 2018-12-21 10:37:01 +08:00 · 2418 次点击
    这是一个创建于 1925 天前的主题,其中的信息可能已经有所发展或是发生改变。
    做了一个网站,网站内容主要是用户提供素材下载.用户可以收藏素材,下载素材
    素材的基础数据包括上传时间\下载数\收藏数.有相关的 tag 标签

    用户查找素材主要是通过搜索框搜索自己想要的内容

    现在使用的是 sphinx+scws 做分词与全文索引

    但是感觉 sphinx 默认的 BM25 这类的排序算法,不能很好的满足综合排序的需求.


    综合排序:
    1、希望最相关的素材优先展示
    2、同级别相关度,希望近一个月新上传素材优先展示
    3、同级别相关度,希望下载数达到一定级别的,下载多的素材优先展示
    4、同级别相关度,希望收藏数达到一定级别的,收藏多的素材优先展示

    5、还有一类特殊需求,是有一个人工推荐字段,希望近期内容热点能通过人工干预排到优先展示的位置。
    1 条回复    2019-01-11 12:49:18 +08:00
    dezhou9
        1
    dezhou9  
       2019-01-11 12:49:18 +08:00 via Android
    这个需要很多模型,你一个个建吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5440 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 06:45 · PVG 14:45 · LAX 23:45 · JFK 02:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.