V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
wty95
V2EX  ›  问与答

everything 能否像搜索引擎一样 模糊搜索?

  •  
  •   wty95 · 188 天前 · 1171 次点击
    这是一个创建于 188 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如 关键词写 "北大招办" 可以搜出来 "北京大学招生办"
    8 条回复    2023-10-22 21:53:41 +08:00
    Mountain
        1
    Mountain  
       188 天前
    写正则
    shendaowu
        2
    shendaowu  
       188 天前
    *北*大*招*办*。这个顺序必须一样。

    北 大 办 招。这个比上面的更好一些,顺序错了也能搜出来。就是所有字中间都加上英文空格。
    shendaowu
        3
    shendaowu  
       188 天前
    如果是同义词那种应该就很难搜出来了。另外建议 OP 把各种可能的情况都说一下,模糊搜索好像包含挺多功能的。
    shendaowu
        4
    shendaowu  
       188 天前   ❤️ 1
    还有个更好一点的方法,需要这个软件: https://seekfast.org/seekfast 。这是个全文搜索的软件。用这个软件主要是因为 everything 搜出来的结果不能按照命中的关键词数量排序。

    用“北|大|办|招”搜索出所有结果,然后导出搜索结果为 txt 文件,最好是给这个导出的 txt 文件单独建一个文件夹。然后用 seekfast 在那个导出的 txt 文件所在的文件夹建立索引。然后搜索“北 大 招 办”,记得勾选“Any of words”。然后大概就会按命中的关键词的个数排序了。感觉跟搜索引擎的效果差不多了,除了同义词之类的。不过我测试的时候发现好像不是严格按照命中个数排序的,看了一下说明,好像关键词的顺序会显著影响排序。

    还有这个软件的排序好像更好一些: https://anytxt.net/ 。不介绍怎么用了,大同小异。我写完上段才发现我下载了这个软件,用了一下发现比上面那个好。

    另外有一些 js 全文索引的库,也许可以写一个自动导入上面的 txt 文件的小程序。我搜了半天也没找到现成的在线导入并搜索的网站。不知道为啥没有,感觉好像用不着服务器资源,直接用静态网站就能做。搞得我都想做一个这样的在线工具了。问一下 OP ,你这个功能用得多不多?或者用的人多不多?或者重不重要?如果多或者重要的话我以后有时间可能会写一个放 github pages 上。毕竟那个 seekfast 的搜索功能有点太简单了。另外我看 V2EX 偶尔会有一些找点子甚至给写工具的人,你有兴趣可以站内搜搜。

    我花了大概两个小时才解决这个问题,OP 我不求你点感谢,就回复一下解决程度就行了。另外我主要是闲得蛋疼才想要解决这个问题的,另外也感觉自己可能会有这个需求,所以就挑战了一下。
    BeautifulSoap
        5
    BeautifulSoap  
       188 天前 via Android
    用正则就行,但是结果并不一定符合你预期

    比如搜出“东北大基金招募办法“之类的
    shendaowu
        6
    shendaowu  
       188 天前
    SeekFast 和 AnyTXT Searcher 好像都只能搜索文件内容,不能搜索文件名。
    shendaowu
        7
    shendaowu  
       188 天前
    收回前面的做小工具的话。我感觉我做不出比 AnyTXT Searcher 更好的工具。
    em70
        8
    em70  
       188 天前
    这个软件可以出个 embedding 版
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1092 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 23:16 · PVG 07:16 · LAX 16:16 · JFK 19:16
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.