1
disk 2020-02-02 02:03:08 +08:00 via Android
粗看了下,没有实际的 pdf,返回的图片,要么爬下来合成。
|
3
ysc3839 2020-02-02 04:31:10 +08:00 via Android 4
|
4
shuangyeying 2020-02-02 06:52:44 +08:00
感谢感谢,很多新书呀。
|
5
magana 2020-02-02 08:23:27 +08:00
这个页面的书可以用浏览器页面打印的方式,打印为 pdf 文件
|
6
fromdark 2020-02-02 09:11:57 +08:00
哈哈哈,最近疫情免费开放,昨天也想下载,没想到没有下载的功能
|
7
yulihao 2020-02-02 09:56:50 +08:00
全是图片啊
|
8
linKnowEasy 2020-02-02 10:04:24 +08:00
有没有书本推荐. 不限题材.
|
9
xyjincan 2020-02-02 10:06:19 +08:00
昨天下载到一半,好像被封了,啥都看不见了
|
10
Mavious 2020-02-02 10:06:55 +08:00 5
|
11
fireflies 2020-02-02 11:54:07 +08:00
@ysc3839 RecursionError: maximum recursion depth exceeded 报错
|
12
InkAndBanner 2020-02-02 12:01:54 +08:00
@Mavious 慧眼识珠
|
14
CNHSK 2020-02-02 12:06:39 +08:00
@ysc3839 Traceback (most recent call last):
File "C:\Users\Administrator\Desktop\wqxt_pdf-master\imgautocompress.py", line 115, in <module> input_file = sys.argv[1] IndexError: list index out of range >>> 怎么解决,大佬 |
16
jakezh 2020-02-02 12:22:42 +08:00
|
17
yamedie 2020-02-02 12:32:59 +08:00 1
用 chrome 的 overrides, 去搞一个名为 read.v5.3.1.722eb.js 的文件, 把 getJwt 暴露到 window 对象上, 一切就迎刃而解了
|
19
ssdde OP @magana 浏览器打印的话,需要所有页面图片都清晰加载一次,而且存储来的 PDF 左下角有页面地址,还有书签符号,和在线客服,怎么去除啊
|
20
ssdde OP 有没有大佬能针对这个站,写一个工具,只要运行,自己粘贴网址就行,啥都不用管的,小白哭求
|
21
sobigfish 2020-02-02 13:47:55 +08:00
放心,下载下来你们以后也不会看的
虽然都是旧版书,但人家是给你看 又不是给你们扒的 |
22
Buges 2020-02-02 13:56:13 +08:00 via Android 4
你先在线读完这本书,然后你就懂如何下载了。
|
23
aguesuka 2020-02-02 14:02:27 +08:00
content-type: image/jpeg
|
25
aviator 2020-02-02 16:48:09 +08:00
哇,感谢楼主,好多书可以看。
|
27
echowxsy 2020-02-02 18:56:00 +08:00
看到请求里面有类似 lib-nuanxin.wqxuetang.com/page/img/3208401/{PAGE}?k={JSONWEBTOKEN}的链接,可以考虑构造链接然后拼装成 pdf
|
28
qq544230987 2020-02-02 19:16:25 +08:00
是假的 PDF,其实是图片~ 你批量下载下来,转成 PDF
|
29
ytf4425 2020-02-02 19:39:07 +08:00 2
aHR0cHM6Ly93d3cubmVrby5vb28vd3F4dWV0YW5nLWRvd25sb2FkLw==
警告:请尊重版权,仅供学习之用,请勿全站拖,请仅下载你需要的部分,请勿缺德爬全站。一切后果与本人及作者无关。 |
40
ssdde OP @ytf4425 纯小白,真不会啊,求大神发送批处理或工具到我邮箱 eWVqaWFsZWk1QGZveG1haWwuY29t
|
41
zhizunzz 2020-02-02 20:29:38 +08:00 via Android 1
@Mavious https://loading.io/ 这个猫之前我用过,在这里找的
|
43
zhizunzz 2020-02-02 20:33:33 +08:00 via Android
|
45
ssdde OP @ytf4425 不会被追责的,自己下载下来又不公开,而且下载的又不多。如果奇迹发生真被追责,我说是我自己写的,好吧,大神,批处理求发给我 eWVqaWFsZWk1QGZveG1haWwuY29t
|
46
sunmker 2020-02-02 21:01:40 +08:00
其实花时间写代码爬,还不如花时间网上找资源来得快
|
53
lisachensyd 2020-02-02 23:24:33 +08:00
@ytf4425 想请教一下大神,jwt secret 会变吗?是不是可以在脚本里写死?
|
54
cyberpoint 2020-02-02 23:28:37 +08:00
右键打印
|
56
ssdde OP @lisachensyd 批处理脚本写好后请发给我,谢谢 eWVqaWFsZWk1QGZveG1haWwuY29t
|
57
ytf4425 2020-02-03 00:07:42 +08:00
@lisachensyd 到目前为止没发现变过,所以应该是可以写死的,如果不放心可以请求那个 js 文件在里面提取出来
@ssdde 对,看完这本书,再看我写的文章,就会了,最后最方便的代码实现需要你会编程(可用 js 编),或者批处理半自动完成。 @asger 代码可以参考#3 大佬发的自己改一下 |
58
zhzy 2020-02-03 00:10:41 +08:00 via iPhone
个人感觉如果真是只为了自己学习还是看那几本经典高质量的书吧……或者去看一些网课 下载一堆下来你肯定不会看的 而且这种带版权的东西 怕不是拖全站然后某宝 9.9 资料全集哦
|
59
ytf4425 2020-02-03 00:19:21 +08:00
|
61
lisachensyd 2020-02-03 01:47:57 +08:00 via Android
@ssdde 不用指望我,3 楼已经有大佬给出 python 脚本了,还有楼上那个指路的大神那篇文章已经讲的很详细了
|
63
lisachensyd 2020-02-03 13:17:39 +08:00
@ytf4425 首先感谢大神的指路,教程很详细,我基本都看懂了,就是现在用 api client 测试的时候能返回一个图片,看二进制文件头是 PNG,但是大小只有 10kb 左右,保存到本地打不开图片,我已经在这个请求的 headers 中加入了 referer, 不知道哪里出了错
|
64
ytf4425 2020-02-03 14:14:12 +08:00
@lisachensyd 如果是文件损坏我没有遇到过。。
|
65
ssdde OP |
68
lisachensyd 2020-02-03 20:49:06 +08:00
@ytf4425 不知道为什么用 REST api 客户端测试就拿不到正确的图片,用 Python 写入二进制就可以了,不管怎么样感谢大神了!
|
69
Buges 2020-02-04 01:04:53 +08:00
@ssdde #65 看了一下,服务端返回了加密的 pdf,请求 /content/authorize 返回文件 url,在 0.f4c9028886a7b391c0df.1574068669001.js 里搜 impower()下断点解密。你先看完那本 js 再弄这个,正好学以致用。
|
70
yamedie 2020-02-04 11:40:16 +08:00
我博客有 chrome 控制台批处理下载详解
歪个楼, 百毒搜 wenquan, 第一个联想词在开车 : D |