如图所示,我要在类似的数据上进行数据处理,剔除前面的 60832 列数据,
然后后面框中数据要切割三段进行收集(这个好处理,按长度切割就可以),但是后面的数据有的后面带空格(如箭头所示)。
现在我的思路是按照数据位置切割(即利用 UltraEdit 的列模式进行区域选择) 但是文本文件数据很大,处理起来 这个不是上上策。。
现在想用 ETL kettle 抽取(朋友推荐的),但是我从未使用过此软件,研究良久没有发现我想要的功能。虽然这个软件真的很强大。
考虑过正则,但是数据并不是特别规则,我写不出来。
总结起来问题就下面三点。
- 在没有太明确规则的数据中(但是宽度差不多相同,除了部分有空格的),怎么切割数据?
- 上述问题大家有没有类似的情况?
- 我是想入库的,最早是利用 navicat 导入向导操作的。但是效率不咋样,而且数据处理的也不完美。现在喜欢上了 kettle,不知道是否可以经过此软件达到我的目的?
