V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
BrightLiao
V2EX  ›  程序员

写给程序员的 ChatGPT 核心模型代码分析,想弄清楚核心模型结构的开发人员们可以关注一下。

  •  
  •   BrightLiao ·
    gmlove · 258 天前 · 748 次点击
    这是一个创建于 258 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本文以 LLAMA 模型的代码实现作为参考( LLAMA 的代码非常短,很适合拿来作为学习材料),结合代码,对 GPT 类大语言模型进行详细分析。

    希望跟大家一起建立起对于大语言模型的代码级别的认知。

    内容包括:

    • 文本生成逻辑(词嵌入、温度参数及 top-p 参数)
    • 模型结构
    • 注意力机制
    • 其他(前馈神经网络、归一化、掩码)

    全文请点击链接: https://brightliao.com/#/NDg4NTA5

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2996 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 14:30 · PVG 22:30 · LAX 07:30 · JFK 10:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.