• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ALLROBOT
V2EX  ›  程序员

v2ex 根据文章提取标签,用的什么模型?

  •  
  •   ALLROBOT · Feb 27, 2023 · 3087 views
    This topic created in 1199 days ago, the information mentioned may be changed or developed.

    如题,V2EX 发帖后,下面自动生成标签,感觉标签划分挺正确的,模型想拿来参考参考

    能发 github 链接供参考学习?

    8 replies    2023-02-28 07:32:22 +08:00
    leimao
        1
    leimao  
       Feb 27, 2023
    经典的是 Latent Dirichlet Allocation 模型
    https://en.wikipedia.org/wiki/Latent_Dirichlet_allocation
    fengleiyidao
        2
    fengleiyidao  
       Feb 27, 2023
    划分正确么?比如隔壁一帖的 tag ,我就感觉驴唇不对马嘴啊 https://www.v2ex.com/t/919496
    SeeWlind
        3
    SeeWlind  
       Feb 27, 2023
    NLP
    ALLROBOT
        4
    ALLROBOT  
    OP
       Feb 27, 2023 via Android
    @fengleiyidao 大多数情况比较正确,只要正文标题写清晰了

    @leimao 自动标签生成用的这模型?

    @SeeWlind 自然语言处理。。听君一席话,如听一席话
    weidaizi
        5
    weidaizi  
       Feb 27, 2023   ❤️ 2
    @fengleiyidao 我觉得那个帖子,"硕大无比" 划分的挺正确的呀 (doge
    leimao
        6
    leimao  
       Feb 27, 2023
    @ALLROBOT Topic Modeling 的历史有二十多年了
    veike
        7
    veike  
       Feb 27, 2023 via Android
    jieba 就可以😄
    OpenSSH
        8
    OpenSSH  
       Feb 28, 2023
    我点开了你的帖子的“标签”这个标签,第一个就看到了站长 2014 年发的这个帖子 /t/96918 ,用的是 jieba
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3996 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 83ms · UTC 05:12 · PVG 13:12 · LAX 22:12 · JFK 01:12
    ♥ Do have faith in what you're doing.