这是一个创建于 4430 天前的主题,其中的信息可能已经有所发展或是发生改变。
1. 比如我有一个 6M - 10M 的 txt 文本是一本英语书, 我又有一个列表, 其中包含着 8000 个英语单词, 我想要把这本英语书中包含在这个列表里的单词标记出来, 是不是用正则式最快呢?
2. 比如 economist 网站中搜索 abatement, 它给出的结果中却又 abated, abating 等同根词, 我能想到是把某些固定结尾(-ment, -ed, -ing)去掉, 再去掉一两个字母, 再搜索.
求指教. 多谢.