V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
troycheng
V2EX  ›  酷工作

[北京]推理优化相关职位招聘(关键词 CUDA/Triton/trt/量化/压缩/蒸馏)

  •  
  •   troycheng · Aug 8, 2023 · 2211 views
    This topic created in 1000 days ago, the information mentioned may be changed or developed.
    长期招聘,需要有相关经验,有意请站内联系或邮件到 [email protected]

    职位描述:
    1. 支持搜索/OCR/NLP 等各方向算法模块的落地和优化
    2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
    3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
    4. 方向三:负责 LLM 大模型推理/训练优化

    职位要求:
    1. 熟悉 linux 环境,熟悉 C/C++和 Python ,熟悉 GPU 体系结构
    2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如 TensorRT/OpenPPL/TVM/AITemplate 等
    3. 熟悉 Pytorch 等常用训练平台,熟悉 OpenMMLab/HuggingFace 等算法模型池,有实际应用经验

    加分项:
    1. 有 CUDA 编程经验优先
    2. 有推理服务实际部署和优化经验优先
    3. 熟悉 ONNX 、TorchScript 等模型转换格式优先
    4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
    3 replies    2023-08-10 11:15:07 +08:00
    israinbow
        1
    israinbow  
       Aug 8, 2023 via Android
    招聘时请尽量给出薪酬范围
    1oscar
        2
    1oscar  
       Aug 10, 2023
    还有公司也不说,这是猎头吧
    tsubin
        3
    tsubin  
       Aug 10, 2023
    而且工作技术方向和技术要求写得太全面了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2773 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 08:11 · PVG 16:11 · LAX 01:11 · JFK 04:11
    ♥ Do have faith in what you're doing.