初版草稿,欢迎意见建议 pip install chinese-regular-expression
。详请见文档和测试用例。
任一("From", "Subject").表达()
=>
r"From|Subject"
序列("$").可无().某字("_", 大小写英文, 中文).某字("_", 大小写英文, 数字, 中文).若干().表达()
=>
r'\$?[_a-zA-Z\u4e00-\u9fa5][_a-zA-Z0-9\u4e00-\u9fa5]*'
序列("<emphasis>", 分段(序列(多个数字, 分段(序列(点号, 多个数字)).若干(3))), "</emphasis>").表达()
=>
r"<emphasis>([0-9]+(\.[0-9]+){3})</emphasis>"
1
oneisall8955 6 天前
想起文言文编程语言😂
|
2
w568w 6 天前 1
恭喜你重新发明了 Parser combinator: https://en.wikipedia.org/wiki/Parser_combinator
|
3
forty 6 天前
你这中英混杂的看着真难受,就像讲话的中英夹杂过多也听了难受一样。
比文言文编程差远了。 文言文写的是: [正则之 From 或 Subject] 不比 [任一("From", "Subject").表达()] 舒服吗? |
4
xuanwu OP @w568w 创作动机请见: https://zhuanlan.zhihu.com/p/323940002 欢迎分享类似实现。
|
6
forty 4 天前
|
8
sead 3 天前
这个除了好玩之外,用起来不别扭吗?
|
10
panlatent 3 天前 via Android
正则表达式是各种符号表达的规则,不像编程语言你把英文换成中文还有些意义。真要是英文的正则也会很别扭的
|