V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lemoon
V2EX  ›  Local LLM

如何系统的深入 LLM?求资源

  •  
  •   lemoon · 287 天前 · 2319 次点击
    这是一个创建于 287 天前的主题,其中的信息可能已经有所发展或是发生改变。
    虽然已经做了很多 LLM 的科研任务,但是感觉自己还是在纯打工,有些深度学习的基础,想进阶提升一下,没找到市面上有什么好课,求推荐
    顺便求一下尚硅谷 AI 大模型课的资源,看课程大纲还不错?
    http://www.atguigu.com/ai/
    12 条回复    2024-02-29 11:39:16 +08:00
    kaiseryang
        1
    kaiseryang  
       287 天前
    可以多翻翻 langchain 的文档和代码
    fredweili
        2
    fredweili  
       287 天前
    楼上说的对,打 log 观察提示词
    Morriaty
        3
    Morriaty  
       287 天前
    复旦出了一本 《大规模语言模型-从理论到实践》,不知道你看过没?讲的比较广,还介绍了分布式训练
    Yuhyeong
        4
    Yuhyeong  
       287 天前
    debug 源码 + 看官方文档
    shinyzhu
        5
    shinyzhu  
       287 天前
    ollama 用起来,玩转才能学会。
    lemoon
        6
    lemoon  
    OP
       287 天前
    @Morriaty 谢谢提醒,刚出的时候就放购物车了一直忘了,下单了哈哈哈
    lemoon
        7
    lemoon  
    OP
       287 天前
    @kaiseryang @fredweili @Yuhyeong 感谢,先仔细看看文档了
    HardyN
        8
    HardyN  
       287 天前
    可以搞本西瓜书看着玩
    Morriaty
        9
    Morriaty  
       286 天前
    reeco
        10
    reeco  
       286 天前   ❤️ 1
    langchain ,ollama 都是应用层的东西,如果你要深入理解 LLM ,看这两个都没啥用,因为这两个本质上就是调 api 。
    要系统得了解 LLM ,还是老老实实从理论开始看起,比如最基本的 《 attention is all you need 》,理解了它你才能看懂 transformer 的模型结构以及推理的代码。有了理论基础后再选个方向深入研究,比如推理部署,模型的结构设计,模型训练微调。现在代码资源很丰富的,没有理论基础,看起来会非常吃力。
    ETCartman
        11
    ETCartman  
       286 天前 via iPhone
    Morriaty
        12
    Morriaty  
       286 天前   ❤️ 7
    顺便借楼主帖子,列下我自己看的,和大家互通有无

    1. 一个博主的 blog ,快速了解 LLM 相关的概念和学习路径: https://gugehome.com/am.php?t=a8pslXGjYFhJ
    2. 《动手学深度学习》,从最基础的 LR 开始一直到 DeepLearning: https://zh.d2l.ai/index.html
    3. transformers 官方 nlp courses ,集中介绍 DL/LLM 如何做 NLP 任务,有机翻中文,https://huggingface.co/learn/nlp-course/en/chapter0/1?fw=pt
    4. 复旦《大规模语言模型-从理论到实践》,主要介绍 LLM ,从 transformer 源码到分布式训练: https://intro-llm.github.io/
    5. 《深度学习推荐系统》- 王喆,实体书,搜广推
    6. 斯坦福大学 cs231n ,Deep Learning for Computer Vision ,据说是最好的 DL 课程,我还没看完,https://cs231n.github.io/convolutional-networks/
    7. 苏神的博客,苏神应该是国内研究 ML/DL 理论比较深的了,写的博客也大多数是原理解析,需要比较深的学术背景 https://spaces.ac.cn/category/Big-Data/1/
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5371 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 02:56 · PVG 10:56 · LAX 18:56 · JFK 21:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.