V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
kimcool
V2EX  ›  问与答

如何防止搜索引擎来抓取内容?

  •  
  •   kimcool · 2012-01-16 17:19:02 +08:00 · 3438 次点击
    这是一个创建于 4725 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近公司在被一些部门核查,导致公司需要屏蔽很多内容,但是大家都知道,一个网站的发展,肯定是需要内容的更新的。

    那在技术上面能否实现,用户发表了一些帖子,然后用户可以看到,然后后台有一个审核系统,经过审核后,搜索引擎就能够抓取了。

    我知道很蛋疼,但是相关部门太厉害了····不知道该怎么办了,来请教各位了!
    10 条回复    1970-01-01 08:00:00 +08:00
    c
        1
    c  
       2012-01-16 17:28:04 +08:00
    在html header里加上索引控制的吧,人肉审核过了,把控制索引的去掉。前提是搜索引擎(baidu)遵循这个规则。
    c
        2
    c  
       2012-01-16 17:29:11 +08:00
    既然有审核,为啥搞这么复杂,直接发帖-》人肉审核--》决定帖子的命运,就好了!
    kimcool
        3
    kimcool  
    OP
       2012-01-16 17:36:04 +08:00
    @c 因为帖子和其他内容太多,没有太多的人来审核····
    lyxint
        4
    lyxint  
       2012-01-16 17:37:36 +08:00
    看他有哪些ip爬你. 就那么几个的话就好办了.

    给每个请求一个session, 把session和ip, user-agent绑定.
    frittle
        5
    frittle  
       2012-01-16 17:38:27 +08:00
    同意ls的,既然要人肉审核,直接人肉审核好了。不过最好的方法还是呼吁用户别发不表「合格」的内容。

    不管用什么方法,在通过审核后,用户在帖子里的跟帖你也不能保证会「合格」,除非每个回复都必须经过审核才能发布,这对网站的ux来说破坏性太大了。
    popoer
        6
    popoer  
       2012-01-16 17:42:19 +08:00
    可以在Robots Meta标签里面控制,主流的大的搜索引擎都还是比较守规矩的
    参考:
    http://baike.baidu.com/view/1011742.htm
    frittle
        7
    frittle  
       2012-01-16 17:44:13 +08:00
    @lyxint 我觉得lz只是希望对搜索引擎屏蔽相关帖子,其他帖子还是希望被搜索引擎索引。如果那搜索引擎属于相关部门,完全拒绝让它爬网站,几天后相关部门发现没爬到新条目时也会察觉吧。
    kimcool
        8
    kimcool  
    OP
       2012-01-16 17:46:57 +08:00
    @frittle 是的,只是希望屏蔽相关帖子

    @popoer 哎,问题相关部门的蜘蛛可是流氓呀
    popoer
        9
    popoer  
       2012-01-16 17:56:04 +08:00
    @kimcool 如果你有办法能识别出相关部分的蜘蛛,那还是容易做到的,否则就只能错杀100也不放过1个了...
    chairo
        10
    chairo  
       2012-01-16 20:21:58 +08:00
    判断用户登录状态,如果产生的内容所属用户ID == 登录的用户ID那么就显示,否则只显示审核通过状态内容...
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1269 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 17:49 · PVG 01:49 · LAX 09:49 · JFK 12:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.