V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
爱意满满的作品展示区。
multiarrow

[开源]使用自然语言进行文件搜索的工具

  •  
  •   multiarrow · Jan 21 · 1312 views
    This topic created in 101 days ago, the information mentioned may be changed or developed.

    网上好像没这类软件,所以我写了一个

    主要功能

    使用自然语言针对文件内容搜索

    适用场景

    • 文件很多
    • 文档、图片、音频混合搜索

    地址

    https://github.com/moyangzhan/mango-desk

    image

    8 replies    2026-01-22 14:50:10 +08:00
    yungo8
        1
    yungo8  
       Jan 21 via Android
    能使用本地的模型那就好了,我看我手机上的相册也支持搜索内容,应该用了本地模型
    multiarrow
        2
    multiarrow  
    OP
       Jan 21
    默认情况下都是在本地运行,不依赖网络。

    不过如果要语义搜索图片跟音频的话,需要用到远程模型,这个要启用并配置 key ,目前这一块默认是关闭的。
    chennqqi
        3
    chennqqi  
       Jan 21
    感觉随便整个本地小模型生成 Everything 语句?
    multiarrow
        4
    multiarrow  
    OP
       Jan 21
    @chennqqi 也不是不行。。。不过只适合至少懂点技术的
    yungo8
        5
    yungo8  
       Jan 21 via Android
    @multiarrow 是有本地分析图片内容构建索引吗?远程模型只是转一下命令内容?
    multiarrow
        6
    multiarrow  
    OP
       Jan 22
    @yeqizhang 远程模型是用来识别图片和音频内容的,构建索引是在本地进行的
    chpw98hv
        7
    chpw98hv  
       Jan 22
    我做了一个类似的软件 https://github.com/diqbpow3c/LocalSearch 。支持混合检索( BM25 关键词检索和基于 embedding 的语义检索同时进行)。软件支持 CPU 和 GPU 运行,Windows, Linux, MacOS 都能用
    multiarrow
        8
    multiarrow  
    OP
       Jan 22
    @chpw98hv 确实是类似软件,话说你不考虑加个中文说明嘛
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2471 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 15:17 · PVG 23:17 · LAX 08:17 · JFK 11:17
    ♥ Do have faith in what you're doing.