V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐工具
RoboMongo
推荐书目
50 Tips and Tricks for MongoDB Developers
Related Blogs
Snail in a Turtleneck
Livid
V2EX  ›  MongoDB

MongoDB 2.4 现在可以做全文索引了

  •  
  •   Livid · 2013-08-04 16:35:10 +08:00 via iPhone · 7032 次点击
    这是一个创建于 4158 天前的主题,其中的信息可能已经有所发展或是发生改变。
    10 条回复    1970-01-01 08:00:00 +08:00
    reorx
        1
    reorx  
       2013-08-05 09:23:00 +08:00
    不知道效率比之 ElasticSearch 等如何,若是不错的话倒是可以在一些数据不多的应用中代替独立搜索引擎。
    merlin852
        2
    merlin852  
       2013-08-05 10:33:53 +08:00
    lj0014
        3
    lj0014  
       2013-08-05 10:41:03 +08:00
    哇!关注下,应该还不支持中文分词吧
    joy2everyone
        4
    joy2everyone  
       2013-08-05 13:01:01 +08:00
    2.4新增的"Text Search"目前仍是beta版本,还不建议在生产环境使用

    http://docs.mongodb.org/manual/tutorial/enable-text-search/
    Livid
        5
    Livid  
    MOD
    OP
       2013-08-05 16:56:20 +08:00
    所以我在考虑的一个可能的应用场景是:

    1. 用 Fluentd 收集各台服务器上的错误日志 error_log
    2. 汇聚到一个 MongoDB 数据库中
    3. 用 MongoDB 2.4 的搜索功能来实现对这些错误日志的分析
    felixonmars
        6
    felixonmars  
       2013-08-05 18:35:45 +08:00
    我还在用以前推荐的方案, 也就是手动分词后创建一个 array 存进去, 然后加好索引. 这样对分词引擎的选择有较大的自由度, 而且性能还能接受 (当然比 sphinx 等纯索引器差不少).

    我用的分词工具是 jieba: https://github.com/fxsjy/jieba
    reorx
        7
    reorx  
       2013-08-05 20:42:26 +08:00
    @Livid 日志分析感觉用正则查询要靠谱一些。
    jinbakei
        8
    jinbakei  
       2013-08-05 20:48:21 +08:00
    @Livid 我今年实习就做这个,已经做好了
    keakon
        9
    keakon  
       2013-08-05 20:51:46 +08:00
    错误日志别分词了,搜个 __init__.py、C++ 咋办
    lenzhang
        10
    lenzhang  
       2013-08-05 22:00:10 +08:00
    碉堡了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5784 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 03:32 · PVG 11:32 · LAX 19:32 · JFK 22:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.