• 请不要在回答技术问题时复制粘贴 AI 生成的内容
rizon
V2EX  ›  程序员

[LLM] 有哪位大佬指点下如何在 cpu 上分布式推理

  •  
  •   rizon ·
    othorizon · Nov 16, 2023 · 2566 views
    This topic created in 918 days ago, the information mentioned may be changed or developed.
    我有很多 32 核的 cpu 机器,想要跨这些机器使用所有的 cpu 算力进行推理。
    这个该怎么做啊?

    是不是部署 k8s 集群就可以,还是有更简单的办法?

    还是说用分布式的 spark 等计算框架?但是具体该怎么搞呢。没头绪
    Supplement 1  ·  Nov 16, 2023
    场景是跑开源大语言模型
    8 replies    2023-11-20 13:20:29 +08:00
    murmur
        1
    murmur  
       Nov 16, 2023
    你做科学计算么,有的科学计算是 cpu 运算+大内存,不过也不是用框架,直接买现成的软件,比如电磁学的 feko
    rizon
        2
    rizon  
    OP
       Nov 16, 2023
    @murmur #1 我就是想跑大模型
    lozzow
        3
    lozzow  
       Nov 16, 2023
    @rizon 可以尝试下 ray ,理论上是支持 transformer 模型的,但是怎么做,我也就看了个文档
    israinbow
        4
    israinbow  
       Nov 17, 2023
    TorchServe 或者黄核弹的 TensorRT? 我们做边缘计算的还有用 ONNX 的, 挑一个吧🫡
    max1911
        5
    max1911  
       Nov 17, 2023
    op 可以试试 ggml 库重新,基于 ggml 上的项目 llama.cpp ,可以实现用 C++运行语言模型
    max1911
        6
    max1911  
       Nov 17, 2023
    max1911
        7
    max1911  
       Nov 17, 2023   ❤️ 1
    @usazcx 如果是 Intel 集群,也可以试试 bigdl.
    https://bigdl.readthedocs.io/en/latest/doc/Serving/index.html
    t133
        8
    t133  
       Nov 20, 2023 via iPhone
    大矩阵的乘法除非你有 infiniband 并行效率惨不忍睹
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2898 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 73ms · UTC 04:46 · PVG 12:46 · LAX 21:46 · JFK 00:46
    ♥ Do have faith in what you're doing.