V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jiyinyiyong
V2EX  ›  分享创造

写了个缩进文本解析器, 以及脚本语言 Cirru

  •  
  •   jiyinyiyong ·
    jiyinyiyong · 2013-10-20 23:22:06 +08:00 · 3676 次点击
    这是一个创建于 4079 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有人喜欢玩编程语言的不, 而且特别讨厌括号的.. 想着用缩进全替换掉!
    对 serious 的编程语言没有多少比较, 但为了日常脚本的方便, 缩进语法有效,
    当然 CoffeeScript 已经很方便了, 差得就是, 这不是我们能随便折腾的语言,
    自己写语言的话, 要学编译原理, 只是解释型语言还好一点..
    比较简单 DIY 一个语言的方案是 Peter Norvig 的 lispy.
    也许很多人都看过了, 中英文两个版本:
    http://norvig.com/lispy.html
    http://www.googies.info/articles/lispy.html
    但对于缩进来说, 解析文本没那么麻烦, 折腾了一年多我终于能写一点了

    从 lispy 出发, DIY 个编程语言两步
    1) 解析文本得到一个数组的语法树
    2) 递归解释执行语法树
    当然为了开发效率和现实场景, 语言不能就这样的, 但玩的话足够了.
    有语法树的情况下, 对数组进行递归, 就可以灵活调用宿主语言.. 我这里是 JS,
    比如 `print (+ 1 2)` 这样的表达式, 嵌套复杂比较麻烦,
    换成 `["print", ["+", 1, 2]]`, 解释执行的难度就小多了,
    类似的数组, 还可以重新编译回文本, 比如编译 HTML CSS 这样生成文件,
    那我想说的是, 通过整理了缩进语法, 我把第一步做好了(代码原型完成),
    第二步的话, 可以有各种想法可以做, 不知道有没有人有兴趣玩

    我的项目是 cirru-parser ,Github 页面上介绍了具体语法对应的解析结果:
    https://github.com/jiyinyiyong/cirru-parser#syntax
    Chrome 用户可以访问我的 Demo, 我把解析对应的数组结构打印出来了
    http://jiyinyiyong.github.io/cirru-parser/
    可能折叠得有点不习惯的多维数组.. `-` 开头标记 Array 一个元素啦

    我自己之前做了解释器试验, 写个简单的解释器, 试验性的介绍:
    http://jiyinyiyong.github.io/blog/posts/131004-cirru-status.html
    然后今天完成了编译到 Mustache 的 Demo, Chrome 可以在线看:
    http://jiyinyiyong.github.io/cirru-to-mustache/


    然后还有 Sublime Text 上比较粗略的语法高亮:
    https://github.com/jiyinyiyong/Cirru.subl
    另外有计划在 CodeMirror 上尝试做语法高亮, 目前没确定好方案

    目前的代码用 CoffeeScript 写的, 兼容 Node 和 RequireJS, SeaJS 加载,
    我业余会花时间在上边, 因为 Mustache 的简版到时也会实际中用到,
    模块目前基本的可用状态, 细节可能还是好再折腾

    如果有兴趣可以留意 Cirru 相关的更新, 目前比较初级, 还能玩下~
    关于早期的愿景可以看这里, 中间的代码是可以编辑, 但比较粗糙~
    http://jiyinyiyong.github.io/article/04-cirru-project/page/index.html
    第 1 条附言  ·  2014-02-02 23:26:51 +08:00
    新的项目地址 http://cirru.org
    7 条回复    1970-01-01 08:00:00 +08:00
    dcoder
        1
    dcoder  
       2013-10-21 02:22:58 +08:00
    在 ruby-china 看到过Cirru的帖子,顶一个!
    zhkzyth
        2
    zhkzyth  
       2013-10-21 20:40:31 +08:00
    赞!!~
    yuelang85
        3
    yuelang85  
       2014-02-02 23:58:38 +08:00
    很酷
    sectic
        4
    sectic  
       2014-02-05 07:20:37 +08:00 via iPhone
    Ast 可以生成 llvm LR,这样llvm就可以编译执行了,llvm也支持解释执行。
    sectic
        5
    sectic  
       2014-02-05 07:23:48 +08:00 via iPhone
    关于括号有个八卦,lisp在论文上用的叫m eexpresion,那个不全是括号。后来第一个lisp实现直接全用括号,s expresion ,然后大家发现这样还不错,然后m expression就没有实现过。
    ianva
        6
    ianva  
       2014-02-09 14:38:23 +08:00
    可以考虑用写工具,手写有点麻烦,比如 jison,javascript 版的flex + bison,或者 peg.js,基于 parsing expression grammar 的文法会很容易折腾
    jiyinyiyong
        7
    jiyinyiyong  
    OP
       2014-03-16 13:01:29 +08:00
    @sectic 未来要考虑下 LLVM, 不过现在还太早了, 做底层的语言没想清楚.

    @ianva 我尝试过的, 可是发现缩进语法用生成工具做太不合适了, 做了一般放弃掉

    V2EX 的通知有问题... 今天加了一条消息才看到这边的..
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2777 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 14:10 · PVG 22:10 · LAX 06:10 · JFK 09:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.