如题,我这里有一堆 word 文档,内容会按标题格式或者序号的形势来排列,有没有工具能够将这些内容结构化出来存到数据库中呢?
1
akagishigeru 2022 年 10 月 20 日 via iPhone
如果只是文字的话,可以解析成 xml 处理
|
2
damai0419 2022 年 10 月 21 日
刚做的需求。
我们是解析 word 试卷,里面还包含图片公式之类的。 word --> html ,然后解 html 。 |