V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 97 页 / 共 133 页
回复总数  2659
1 ... 93  94  95  96  97  98  99  100  101  102 ... 133  
2019-11-22 23:31:29 +08:00
回复了 AltairXsss 创建的主题 Python 并发和异步的问题
@sylvos #7
可以看看 quora 和 Reddit 上的老帖, 里面把很多场景讲的比较完整了, 我一时半会说不太清, 提一下简单的理解, 主要思路就是生产者消费者那套, 场景也比较典型

python 内置的 Queue 就可以当一个简易版的消息队列来用; 略微粗糙的也可以用 redis 的 list, 是能抗高并发的; 进一步的就是 kafka 那些. 对 python 来说, 想利用多核很考验水平, 但是如果把任务丢到消息队列的话, 那多核利用可以简单地通过无脑开启多个执行进程, 然后单线程从消息队列里消费任务就可以了, 任务隔离不用考虑那些锁的情况了

比如处理并行任务的竞态条件, 并发数很大但又不想用锁的话, 可以把所有任务丢到一个队列里(这一步是线程安全), 统一单线程处理, 目的就是缓解高并发的压力

或者有些实时性要求不高的任务异步处理, 常见的就是大批量数据入库的时候, 或批量发邮件的任务, 因为频率太高会导致触到邮件服务的 rate limits, 所以把任务慢慢进行, 也能记录任务进度

或者要保证消息的时序性, 所以把消息放在队列里

近几年应该也有了一些其他新的用途, 一时半会想不大起来别的. 总结常见用途就是: 按时序存储消息和消费消息; 异步任务, 缓解高并发压力, 或者异步转同步控制消费速度.
2019-11-21 17:07:41 +08:00
回复了 zhuzhuaini 创建的主题 Python Python 如何从一个文本中取每一行到另外一个文本中匹配
@zhuzhuaini #7

https://paste.ubuntu.com/p/W6Qq4mtjfv/

如果是面试题, 这段代码基本涵盖所有考点了, 但是很多小细节有炫技嫌疑...

1. with 打开文件保证安全关闭
2. seek 方法保证只需要打开一次文件 B 不需要多次打开
3. 对文件对象 A B 使用 for 循环, 节省内存
4. for 循环的 else 用法
5. with 上下文一次打开多个文件
2019-11-21 16:42:41 +08:00
回复了 rogerreus 创建的主题 问与答 请问后台系统框架设计用的是哪方面的知识?
1 楼 2 楼说的没错... 没接触过从头开始, 时间不一定够吧, 不过没毕业的话, 应届生光环加成, 这种项目也是有用的

现在提到系统设计一般就是下面这个 Github, 中文版也有, 熟悉下试试

https://github.com/donnemartin/system-design-primer

写论文还是题目越小越好写...
2019-11-21 16:38:45 +08:00
回复了 zhuzhuaini 创建的主题 Python Python 如何从一个文本中取每一行到另外一个文本中匹配
忘了 file_object 可以直接丢到 for, 不需要 readline...
2019-11-21 16:38:04 +08:00
回复了 zhuzhuaini 创建的主题 Python Python 如何从一个文本中取每一行到另外一个文本中匹配
需要掌握打开文件按行读取的 file.readline()
需要用到调整文件读取指针位置的 file.seek(0)
然后迭代器开几个 for 循环的函数, 共享已经打开的 A 和 B 俩文件就好了, 一般是在一个 with 下面俩文件对象, 然后写一个函数, 传参 line_text, file_object, 因为是迭代器, 内存占用还算可以接受

按你提的方式, 性能也高不到哪去了, 不过比现写个前缀树要省心多了
2019-11-21 16:08:57 +08:00
回复了 keelii 创建的主题 Python Assembly - 一个基于 Flask 且 Pythonic 的面向对象 Web 框架。
看过 Benchmarker 那项目以后, 我基本只在 falcon hug starlette fastapi 这些 python 库里翻腾了...

Assembly 何必要基于 flask (虽然生态好...), 基于 falcon 那些 C 加成的速度快的多了(就像 hug...)

这项目扫了一眼, 语法骨骼惊奇, 让人眼前一亮是真的有, 我都以为是什么其他的语言... 写个 view 连个 def 都不用, 太有意思了
2019-11-21 16:05:10 +08:00
回复了 spiderGgl 创建的主题 Python 天眼查爬虫新姿势
@spiderGgl #14 很多东西, 民不告官不究, 我只是说前面那些提到逆向的人, 你给的这套是常规自动化加中间人的, 以前用过类似的真机上用 adb 唤起拿 token 的方式, 一个原理, 不过用的是 tasker 写出来的 app. 现在爬虫不好干, 赶紧转行溜了, 想起以前别人的那句: 爬虫难不是难在怎么抓的快, 难在怎么抓的慢... 亏我之前各种调研哪个 http 库性能高, 发现 aiohttp 有 C 加成超过很多其他的库, 然后 golang 的内置库又给我刷新三观... 溜了
2019-11-21 15:58:35 +08:00
回复了 weiruanniubi 创建的主题 问与答 如果是你,你会怎么做?
扫了一眼, V 站多数人价值观还是正的
2019-11-21 15:49:09 +08:00
回复了 spiderGgl 创建的主题 Python 天眼查爬虫新姿势
逆向 app 拿签名虽然不太麻烦, 就是要进去坐 2 到 5 年有点费时间
2019-11-21 15:46:02 +08:00
回复了 hztnrzcy 创建的主题 计算机 大一新生,老师让自学 Python , Java , c
如果后续有数据结构算法课, 肯定得从 C 开始
python 不是高考顺便就学了么
2019-11-21 15:42:24 +08:00
回复了 cwjokaka 创建的主题 程序员 刷 Leetcode 对非专算法的工作有帮助吗📈
一方面对编程思路有好处, 加深很多数据结构和算法的理解
另一方面, 应试教育啊, 别人都刷了题, 你不刷, 面试时候就被刷, 因为有的题在面试给的那么三四十分钟现想并且直接给代码, 还真有点难度...
2019-11-21 15:37:47 +08:00
回复了 Godykc 创建的主题 职场话题 谈谈我近两个月跳槽所踩的坑,前车之鉴,后车之覆
那些大写字母公司一个都不认识......
过段时间也要准备求职, 看完压力山大
记笔记: 拉钩快不行了, 用 boss 直聘
2019-11-21 08:46:18 +08:00
回复了 MortyP 创建的主题 程序员 在北上要搬多少才能活下去呀??
前两年不是有过调查了么, 23K 以上
2019-11-20 18:59:59 +08:00
回复了 Tianny 创建的主题 Python 问个 Python 字典转换问题。
2019-11-19 10:08:45 +08:00
回复了 wenjor 创建的主题 知乎 v2 用知乎的人多吗,最近质量下降严重,有没有其他类似论坛?
@est #14 有蔷在, 再差也差不到哪去, 我也就看看热门的, 配合 hackernews 了解点新鲜东西, 没太多时间划水
2019-11-19 09:45:53 +08:00
回复了 Fufh 创建的主题 Windows 老毛桃的官网是 laomaotao.net 还是 laomaotao.org
老毛桃 大白菜 完美 PE 的时代已经过去了, 现在很多假的, 这俩域名貌似都对, 但是我都查到毒...... 不敢用了, 还老是给我改首页或者加开机广告, 就算做了那个推广任务去掉广告, C 盘里也有垃圾文件没清除

这几年已经是微 PE 和优启通的时代了
2019-11-19 09:01:21 +08:00
回复了 wenjor 创建的主题 知乎 v2 用知乎的人多吗,最近质量下降严重,有没有其他类似论坛?
最近那么多 "如何看待 XXXX", 就知道多不多了

quora 我也用不习惯, Reddit 是真不错

减少划水时间才是良方
1 ... 93  94  95  96  97  98  99  100  101  102 ... 133  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1670 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 16:42 · PVG 00:42 · LAX 08:42 · JFK 11:42
Developed with CodeLauncher
♥ Do have faith in what you're doing.