V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
warcraft1236
V2EX  ›  Python

Python 读取文本文件,怎么才能读取一段内容呢?

  •  
  •   warcraft1236 · 2017-07-18 00:32:58 +08:00 · 8314 次点击
    这是一个创建于 2734 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Python 新手

    有个文本文件,格式大概是这样的

    一些内容....
    ###START RECORD
    一些内容....
    ###END
    一些内容...
    

    我想读取从 ###START RECORD 开始到 ###END 这段的文本

    请问有什么比较好的方法吗?

    13 条回复    2017-07-18 13:37:36 +08:00
    ysc3839
        1
    ysc3839  
       2017-07-18 00:42:54 +08:00 via Android
    用 find 找到两个 pattern 然后 string[find1+len (pattern1):find2]
    misaka19000
        2
    misaka19000  
       2017-07-18 00:46:36 +08:00 via Android
    应该不能,操作系统读取文件的系统调用不能根据文件内容来判断吧,只能读到内存中再做处理了
    ryd994
        3
    ryd994  
       2017-07-18 06:36:30 +08:00 via Android
    一行行读了判断呗………
    zeraba
        4
    zeraba  
       2017-07-18 08:04:50 +08:00 via Android
    呐 把每一行先读出来 就像 3 楼说的 存到列表 然后开始找开始行和结束行的第一个索引 找到之后把内容存到另一个列表 并删除旧列表里面响应内容 然后继续循环
    dawnven
        5
    dawnven  
       2017-07-18 08:13:04 +08:00
    正则表达式
    dangyuluo
        6
    dangyuluo  
       2017-07-18 08:46:37 +08:00
    感觉效率比较高的方法是一行一行读,然后根据格式判断。
    正则表达式就有点杀鸡用牛刀的感觉了。
    warcraft1236
        7
    warcraft1236  
    OP
       2017-07-18 09:54:28 +08:00
    @dangyuluo 正则表达式效率会比较低吗?
    wzha2008
        8
    wzha2008  
       2017-07-18 10:12:58 +08:00
    按行读入内存,读到 start 后每行加入列表,再读到 end 就 break
    yylucifer
        9
    yylucifer  
       2017-07-18 11:08:13 +08:00
    @warcraft1236 用正则文本多了会很低。。
    要讲效率,应该一行一行处理是比较高的
    ToughGuy
        10
    ToughGuy  
       2017-07-18 11:38:59 +08:00   ❤️ 1
    def read_part(filename, start='###START RECORD', end='###END'):
    ----content = []
    ----recording = False

    ----with open(filename) as f:
    --------for line in f:
    ------------line = line.strip()

    ------------if line == end:
    ----------------break

    ------------if recording:
    ----------------content.append(line)

    ------------if line == start:
    ----------------recording = True
    ----return '\n'.join(content)
    scriptB0y
        11
    scriptB0y  
       2017-07-18 11:52:08 +08:00
    查一下是第几行然后 seed
    warcraft1236
        12
    warcraft1236  
    OP
       2017-07-18 13:34:41 +08:00
    @ToughGuy 多谢,我明白了
    VYSE
        13
    VYSE  
       2017-07-18 13:37:36 +08:00 via Android
    mmap
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1725 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:40 · PVG 00:40 · LAX 08:40 · JFK 11:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.