这是一个创建于 2192 天前的主题,其中的信息可能已经有所发展或是发生改变。
做了一个网站,网站内容主要是用户提供素材下载.用户可以收藏素材,下载素材
素材的基础数据包括上传时间\下载数\收藏数.有相关的 tag 标签
用户查找素材主要是通过搜索框搜索自己想要的内容
现在使用的是 sphinx+scws 做分词与全文索引
但是感觉 sphinx 默认的 BM25 这类的排序算法,不能很好的满足综合排序的需求.
综合排序:
1、希望最相关的素材优先展示
2、同级别相关度,希望近一个月新上传素材优先展示
3、同级别相关度,希望下载数达到一定级别的,下载多的素材优先展示
4、同级别相关度,希望收藏数达到一定级别的,收藏多的素材优先展示
5、还有一类特殊需求,是有一个人工推荐字段,希望近期内容热点能通过人工干预排到优先展示的位置。
1 条回复 • 2019-01-11 12:49:18 +08:00
|
|
1
dezhou9 2019-01-11 12:49:18 +08:00 via Android
这个需要很多模型,你一个个建吧
|