Python selenium 的 webdriver 如何可以获取到一个 url get 请求下的所有子资源的请求?比如图片, js,jsoup 之类的; 需求是想做爬虫,但有些信息在页面上并不显示,只有在子请求返回的 jsoup 里才有,我要找到这个 jsoup 的 url 请求,然后再单独发起一次 get 即可获取到我想要的数据;不要问为什么不直接 F12 从 network 里抓包找到对应的 http 接口,这个接口带有签名,只有通过 selenium 访问生成签名后,再基于带有签名的 url 去拿数据,这也是为什么要用 selenium 的原因。 我目前的思路有两个:
- 基于 scapy 抓包,找到对应的 url ,再单独发起请求。 2.打开 chrome://net-internals/#events 进行监听找到对应的 url 。 这两个方法都比较麻烦,不知道 selenium 有没有自带的接口可以获取到所有 url 的请求, get_log () 里也没找到。 或者说 selenium 如果能直接捕获到子 url 请求的结果也可以,比如某个子请求的 url 返回的 jsoup 。理论上一定是捕获到了的,要不然后无法生成最终页面,只是不知道如何单独提取出来。