V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
iorilu
V2EX  ›  程序员

我有个想法, 就是现在应该发明一种专用于大模型生成的语言

  •  
  •   iorilu · 1 天前 · 3937 次点击

    现有的所谓 AI 辅助开发, 都是利用现有的语言

    现有的语言, 当然目标都是让人类去编写的

    但现在前提不一样了

    所以我认为应该有一种新得语言, 满足以下目标

    • 主要用于大模型理解, 输入, 输出
    • 语言必须简单, 易懂, 关键字, 特性尽量少, 或标准化, 简单来说就是, 为了满足一个简单需求应该只有一种写法, 比如 go 只有 for 循环
    • 语言必须是编译的, 强类型的, 因为由于大模型 ai 工具的原因, 可编译性语言可以大大提高模型生成正确率, 因为模型可以自己不断编译改错直到编译成功
    • 语言可以比较繁琐, 但必须易读易懂 (rust 就不合格)
    • 语言语法必须尽量兼容当前流行的语言或一些约定俗成的语法, 不发明新语法(rust 是反例)
    • 语言的设计包括文档标准格式等, 简单说就是文档就是给模型的 prompt, 是有标准格式的, 其实就是设计文档

    我判断应该很快就有大厂做这事, 隐约感觉 go 还蛮合适的, 当然肯定要经过改造

    这样以后包括文档, prompt 等等都能标准化, 大模型输入输出更精准, 因为只需要考虑一种标准化语言

    47 条回复    2025-12-06 01:22:13 +08:00
    realpg
        1
    realpg  
    PRO
       1 天前
    没有海量的互联网搜索资源的语言 任何 AI 都写不出代码
    achira
        2
    achira  
       1 天前
    什么时候可以针对语言的多种不同性能参数调教才能 one for all ,说白了就要你方便看懂,大模型理解输入输出对他来说有什么难度?反而舍弃了很多性能和简化方法《繁琐+易读懂》就是很矛盾的既要还要。不发明新语法 AI 怎么进步,AI 目前还是完全基于统计学的,没有 AI 能真正发明创造的东西。
    fwh
        3
    fwh  
       1 天前
    davin
        4
    davin  
       1 天前
    大多数模型输出不都是以 Markdown 格式为主么?输入的类型就多了,音视频,图像,各种格式的文本/JSON 等等
    iorilu
        5
    iorilu  
    OP
       1 天前
    @realpg 那是以前, 现在模型已经有了足够的能力

    后续稍微在新语言上训练即可

    标准化的语言以后必然可大幅增加模型一次性生成正确代码的能力
    showonder
        6
    showonder  
       1 天前
    先不说怎么训练大模型掌握这种非自然语言,我觉得完全没必要创造一种语言,直接让大模型把自然语言转机器码得了,一步到位
    chandlerbing9317
        7
    chandlerbing9317  
       1 天前
    记得看过一个结论,说 AI 生成的 golang 的代码准确率很高,但生成 C++、Rust 就会差一些,可能语法都有问题
    dapang1221
        8
    dapang1221  
       1 天前
    本末倒置了,你知道为什么大模型的输入是自然语言吗?因为训练数据就是自然语言。这不是刻意而为之,而是没办法的事,正因为训练数据基于自然语言,所以格式化输出及调用外部方法都是一个麻烦的事情。。。
    zealotxxxx
        9
    zealotxxxx  
       1 天前
    你难道不知道有一个 tokenizer 这个东西吗?大哥,模型的参数都是向量矩阵好不好
    allenzhangSB
        11
    allenzhangSB  
       1 天前   ❤️ 2
    思而不学则殆
    fcvi44
        12
    fcvi44  
       1 天前
    结果随着迭代发展,转过头一看妈呀这不就是 java/php/python 自然语言版吗
    NewYear
        13
    NewYear  
       1 天前
    你是不是在找 C# ?
    Gnnbb
        14
    Gnnbb  
       1 天前
    其实不就是 prompt 吗。标准化的 prompt ,你所谓的语言,是不是标准化后的 prompt ,然后在这基础上再更加的完善?
    johnbobby
        15
    johnbobby  
       1 天前   ❤️ 1
    这种语言的发明者也应该是 AI ,AI 开发一种专门用于 AI 编写代码的语言
    1daydayde
        16
    1daydayde  
       1 天前
    又一个本末倒置的?你去和前几天那哥们一起做一个吧,真的。
    XnEnokq9vkvVq4
        17
    XnEnokq9vkvVq4  
       1 天前 via iPhone
    这就像 ai 有时候会用其他语言思考一样。继续演进下去,可能不会有新的语言,而会有类似于方言的东西出现
    iorilu
        18
    iorilu  
    OP
       1 天前
    @Gnnbb 标准化的 prompt 是输入
    输出也必须是标准化的

    这个都是在语言定义时候就规范好的

    可以说, 这种语言的文档也必须是规范化的, 有语法的, 甚至必须经过工具验证过才行

    有了规范的输入, 必然可以大大提高输出的正确性

    另外之所以要一个新语言, 就是从设计上就考虑到这种语言, 主要是用来编译执行, 主要有模型输出

    人只负责文档编写
    sagnitude
        19
    sagnitude  
       1 天前
    想提高正确性,应该强化 ai 的逻辑思考能力,而不是靠大量代码的影子去猜
    Peiiii
        20
    Peiiii  
       1 天前 via Android
    typescript 是 Agent 时代第一开发语言,不接受反驳
    aoyi
        21
    aoyi  
       1 天前
    不觉得新语言需要发明,而觉得 AI 无法时刻辅助这一点需要发明,类似药老 这种 24h 随身辅助,随时内部询问
    cheng6563
        22
    cheng6563  
       1 天前
    直接训练生成二进制程序的模型如何?
    llsquaer
        23
    llsquaer  
       1 天前
    应该是 AI 成熟之后,至少逻辑推理得分 99 之后,自我更迭出一种语言,要求需要同时满足人类阅读.

    现在这么多编程语言,各有优劣.但是都没有统一的格式语法,除了静态语言外,动态语言里,就看 python 和 ts 现在能打.

    所以目测 动态编程里面,应该是 python+ts 的混合体.
    cherryas
        24
    cherryas  
       1 天前
    对也不对,你说的需要 ai 生成代码的速度再快 50-100 倍。
    QS0x01
        25
    QS0x01  
       1 天前
    什么开倒车,训练大语言模型就是为了能用自然语言输入。

    Vibe Coding 的目标就是让任何人都能不需要付出学习成本就能写程序。包括之前用的各种框架前端框架、依赖注入框架......
    都是为了降低门槛,程序员和其它高薪职业的区别就在这里,主打一个开源,绝不设计围墙。

    给你标准化以后,大家又得多学习一门语言了,那还要啥 llm
    greygoo
        26
    greygoo  
       1 天前
    如果输入都是一种形式语言,那不是就是开倒车吗,如果是输出要新的语言,不太清楚你提的这些目标是否可以解决现在 ai 生成代码的痛点。
    levelworm
        27
    levelworm  
       1 天前 via iPhone
    其实就是用人去适应人工智能,和我的想法类似。我觉得人工智能走进家庭的前提是家庭环境适应人工智能。
    KingHL
        28
    KingHL  
       1 天前
    大模型是在模仿,而不是理解,没有海量数据的情况下,只给他语法规则,他是无法理解一门新的语言的
    subpo
        29
    subpo  
       1 天前
    web 语言,我觉得是 ruby on rails
    约定优于配置,天生的 full stack
    约定优于配置的好处是把整个文档喂给 ai 后,他会怎么写代码,在哪里写代码,都是可预知的,这太牛逼了
    EscYezi
        30
    EscYezi  
       1 天前 via iPhone
    记得 moonbit 之前宣传 ai 友好,现在官方搞 agent
    https://docs.moonbitlang.cn/pilot/moonbit-pilot/getting-started.html

    说起来适合 llm 的语言还得有空安全和类型安全,或者至少能
    EscYezi
        31
    EscYezi  
       1 天前 via iPhone
    @EscYezi 手滑发出去了,至少能在 lint/编译时确保没问题。还有语言表达能力不能太弱,不然浪费 token 而且生成代码太多不好维护。感觉 ts 就很不错
    Vaspike
        32
    Vaspike  
       1 天前
    以前我考虑过, 把 markdown 的语法和文件类型改一改, 但是改得越复杂就越难上手, 太简单又信息量不足
    klo424
        33
    klo424  
       1 天前
    @sagnitude AI 逻辑的基础就是猜,没有你说的猜,今天就没有这么方便的 AI 。
    liuzhedash
        34
    liuzhedash  
       1 天前
    这种新语言的语料几乎没有,AI 怎么去掌握?
    应该说从 copilot 出现的那一刻起,再也不会有新的编程语言被广泛使用了
    Ketteiron
        35
    Ketteiron  
       1 天前
    @EscYezi #31 schema 优先的 ts 暂时是不错的选择,没有大量类型传来传去,但还是能够保证严格的类型检查,lint 检查比其他语言强很多。
    MaxwellX
        36
    MaxwellX  
       1 天前
    你可以了解一下大模型的原理,我之前看过一点,他本质上还是根据前一个词预测下一个 token,基于足够大的数量级,就成为了现在的 AI,所以我感觉基于这种新创造的语言没啥优势
    sagnitude
        37
    sagnitude  
       1 天前
    @klo424 所以他不能保证正确性啊,他方便不方便和我说的东西没关系,因为程序本身就是有顺序有逻辑的,不去理解真正的逻辑就没法保证正确性,也没法保证真正的效率,现在返工率和准确性都还是比较差。
    语法的问题它可以去调用编译器不断地返工修正,逻辑的问题他只能靠不断地提示词修正,造成大量的资源浪费,而人类做项目是按照逻辑自顶向下的
    AEDaydreamer
        38
    AEDaydreamer  
       1 天前
    输入标准化那不是又成另一门和计算机沟通的语言了, 输出的话既然现有那么多高级语言似乎没有造新轮子的必要.
    mizuhashi
        39
    mizuhashi  
       1 天前
    我覺得需要有一個 spec 語言,用來表達業務模型,使得給定一個 spec ,ai 可以生成一致的實現
    Vcide
        41
    Vcide  
       1 天前
    从原理上讲,大模型在高维空间中对不同编程语言的模式已经有了很强的区分和生成能力。更直接高效的路径应该是致力于强化模型与现有成熟语言及工具链的协作,比如为 Python 或 Go 定义一个风格极端严格、模式唯一的子集之类的。
    klo424
        42
    klo424  
       1 天前
    @sagnitude 你没理解我说的。你想要有顺序有逻辑,以目前的技术就做不出 AI 这个产品。现在之所以有 AI ,就是因为靠猜,它就不是按照人类的逻辑去设计的,也就不可能达到你想要的逻辑正确性。
    sagnitude
        43
    sagnitude  
       1 天前
    @klo424 我理解,但我的意思是他能不能做到,或者他能不能存在,和我提出建议有啥关系?

    而且逻辑正确性也有人在做,比如专门做数学推理的,如果有了成果自然可以内化推广出去,并非不可行。像前几天的 DeepSeekMath-V2 ,就着重于推理的步骤
    laminux29
        44
    laminux29  
       1 天前
    必然是 C# 了。

    C# 语言,从底层汇编式的精准控制,到 js 样式的高度优化的高级别语法糖与 Lambda 表达式,从 C++ 的强类型到 Python 的弱类型,都擅长,是当今最好的编程语言。可惜一手好牌被微软打地稀烂。
    xixi1412
        45
    xixi1412  
       1 天前
    其实 markdown 就是
    HankAviator
        46
    HankAviator  
       1 天前
    很多公司里常见的一个问题是,说话人自以为自己说的很清楚,实际上并不是——内容密度低,抓不住重点,准确度差。这种情况就算是用“最精确”的法语也无济于事
    chenjunnan
        47
    chenjunnan  
       20 小时 7 分钟前
    你这就是吃了第五个馒头,前四个没用了,技术大厦都是一层一层发展起来的,不存在跳跃的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2746 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 13:30 · PVG 21:30 · LAX 05:30 · JFK 08:30
    ♥ Do have faith in what you're doing.