V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
luckyzd
V2EX  ›  程序员

有没有兴趣给 “冲顶大会” 开发个找答案的软件

  •  6
     
  •   luckyzd · 2018-01-04 14:00:17 +08:00 · 15055 次点击
    这是一个创建于 2507 天前的主题,其中的信息可能已经有所发展或是发生改变。

    冲顶大会山寨了国外的 HQ Trivia,都是线上答题分奖金,10 秒钟一题,12 题全部答对就可以分奖金。王思聪微博给宣传,今晚上 9 点瓜分 10w 奖金。大家有兴趣做个图像识别加搜索答案的软件么?

    102 条回复    2018-01-18 12:24:59 +08:00
    1  2  
    moshao6
        1
    moshao6  
       2018-01-04 14:24:54 +08:00
    这个想法不错,可以一试
    580a388da131
        2
    580a388da131  
       2018-01-04 14:41:44 +08:00
    所以是要变成外挂论坛么 233
    geekcorn
        3
    geekcorn  
       2018-01-04 15:03:58 +08:00
    岂不是跟跳一跳如出一辙,截图,文字识别,搜答案,ADB 模拟点击。
    rxzxf1993
        4
    rxzxf1993  
       2018-01-04 16:51:28 +08:00
    有题库吗
    geekcorn
        5
    geekcorn  
       2018-01-04 17:33:31 +08:00   ❤️ 2
    已经撸完一个最简单版本。adb 截图传输到电脑,PIL 剪裁出问题的部分丢给 pytesseract 识别,然后自动打开百度和必应的结果。全程 3 到 5 秒。今晚看看效果,可以的话可以丢仓库里开源。
    arronf2e
        6
    arronf2e  
       2018-01-04 17:35:45 +08:00
    GuangTsang
        7
    GuangTsang  
       2018-01-04 19:33:16 +08:00
    用另一个手机扫 题目 直接出答案
    JohnChiu
        8
    JohnChiu  
       2018-01-04 21:19:46 +08:00
    刚看了题目,很多题目很难搜出结果,会有新闻干扰,不太现实
    geekcorn
        9
    geekcorn  
       2018-01-04 21:41:16 +08:00
    刚看了一场,4 到 5 秒还只是给出百度的结果是无法答题的。录播推流有延迟,而答题截至时间戳固定,导致每个问题实际只有 3 到 4 秒的回答时间。好在抓包很轻松看到题目。题目属于原创,很多题目光搜索是没用的,例如第十题:

    以下音乐家里,去世时最年轻的是:(1)肖邦(2)莫扎特(3)舒伯特

    实际是问,以上三个人谁的寿命最短,分别搜索三人的寿命,时间早就过去。
    rookie603
        10
    rookie603  
       2018-01-04 21:50:16 +08:00
    所以说多放点题库搜
    diveinto
        11
    diveinto  
       2018-01-04 22:08:09 +08:00
    “ PIL 剪裁出问题的部分丢给 pytesseract 识别” 这部分咋做的

    怎么剪裁出问题的部分?
    diveinto
        12
    diveinto  
       2018-01-04 22:09:57 +08:00
    @geekcorn 直接出答案难度太大,但是能快速识别问题,让搜索引擎辅助下还是挺有用的
    jwenwang
        13
    jwenwang  
       2018-01-04 22:14:13 +08:00
    国外原版叫 HQ,确实有黑客做了类似的东西
    chengzhoukun
        14
    chengzhoukun  
       2018-01-04 22:17:58 +08:00 via Android   ❤️ 1
    “ I Hacked HQ Trivia But Here ’ s How They Can Stop Me ” @stervyc https://hackernoon.com/i-hacked-hq-trivia-but-heres-how-they-can-stop-me-68750ed16365

    iOS 用投屏,Android 投屏或者 adb,然后像五楼说的一样操作就行
    nszm
        15
    nszm  
       2018-01-04 22:25:44 +08:00
    @geekcorn #9 莫扎特最短....
    lloovve
        16
    lloovve  
       2018-01-04 22:40:07 +08:00 via iPhone
    要把电视节目玩剩下的搬到手机端,这个就是一站到底啊,以后会不会出,网络相亲节目
    geekcorn
        17
    geekcorn  
       2018-01-04 23:45:31 +08:00
    @diveinto 目前要根据分辨率来适配吧,或者直接识别白色的部分。具体在这里了,其实很简短的几行 https://github.com/se4/cddh

    顺便感谢各位大佬的信息和建议,直接从接口获取题目然后用 上文 chengzhoukun 大佬提到的文章里的方法来做应该是最可靠的,明天试试看
    geekcorn
        18
    geekcorn  
       2018-01-04 23:50:36 +08:00
    @nszm 嗷 我还以为是舒伯特大师
    wzwwzw
        19
    wzwwzw  
       2018-01-04 23:54:14 +08:00
    研究下获取题目的接口,和提交答案的接口,然后中间搜索一下,不久美滋滋了。
    nszm
        20
    nszm  
       2018-01-05 00:29:10 +08:00
    @geekcorn #18 你是对的
    gclove
        21
    gclove  
       2018-01-05 00:35:40 +08:00
    百度如果都能搜到,那还答个屁啊
    zlbzhf
        22
    zlbzhf  
       2018-01-05 10:07:50 +08:00 via iPhone
    识别,随机答,正确,记入题库(正确答案),错误,记入题库(错误答案,用于下次或者别人答题的时候回避)。大家一起贡献题库,是不是可行?
    qgb
        23
    qgb  
       2018-01-05 13:18:53 +08:00 via Android
    @zlbzhf 官方题库哪里来的
    cheetah
        24
    cheetah  
       2018-01-05 13:41:07 +08:00
    @zlbzhf 题目会重复使用?
    1005gel
        25
    1005gel  
       2018-01-05 13:51:46 +08:00
    额 楼上有抓到获取题目的接口?
    geekcorn
        26
    geekcorn  
       2018-01-05 14:15:22 +08:00
    嗯。。。我再多句嘴,哪位大佬有开通过 google cloud platform 平台吗?今天中午测试通过了,准确率还可以 8 /12,只是需要用到 自定义搜索 这个接口, 每天免费调用 100 次,多了要收费。
    zlbzhf
        27
    zlbzhf  
       2018-01-05 14:50:32 +08:00 via iPhone
    @qgb 这个就相当于自己搞服务器存储了。
    zlbzhf
        28
    zlbzhf  
       2018-01-05 14:51:05 +08:00 via iPhone
    @cheetah 这个不清楚,感觉应该有重复吧。
    callmexiaoliu
        29
    callmexiaoliu  
       2018-01-05 16:39:04 +08:00
    主要是题不好答吧
    geekcorn
        30
    geekcorn  
       2018-01-05 20:33:55 +08:00
    @zlbzhf 刚主持人说了,每个星期都有复习赛,题目从出过的题目里抽。
    geekcorn
        31
    geekcorn  
       2018-01-05 20:36:57 +08:00
    每天两场,题目接口不需要认证,答案接口需要认证。让机器人自己读取了存库里,复习赛秒杀即可。推荐使用 Leancloud。或者很多网站连载题库,爬取了保存也行。
    Julio
        32
    Julio  
       2018-01-06 10:39:45 +08:00
    @geekcorn 题目接口地址,你拿到了吗?
    geekcorn
        33
    geekcorn  
       2018-01-06 13:00:02 +08:00
    @Julio 已经开源了,这个抓包就能看到了,顺便完成了模拟登陆和认证的过程,用来查询答案,考虑到这个东西肯定有人会拿走卖钱,所以暂时不放出来了
    v1nce0t
        34
    v1nce0t  
       2018-01-07 01:27:08 +08:00
    @geekcorn 百万英雄和芝士超人好像抓不到题目接口,可否也看一下
    v1nce0t
        35
    v1nce0t  
       2018-01-07 01:40:26 +08:00
    @geekcorn 另外你 google cse 的指定的网站是哪个呢?
    geekcorn
        36
    geekcorn  
       2018-01-07 18:20:26 +08:00
    @v1nce0t google coustom search engine,需要开通 google cloud platform,打算做一个符合国情的必应百度 360 版本。ID 是自定义谷歌搜索引擎的识别 ID,https://developers.google.com/custom-search/docs/tutorial/creatingcse,KEY 是 google cloud platform 通用 key。
    geekcorn
        37
    geekcorn  
       2018-01-07 18:25:05 +08:00
    @v1nce0t 啊好,我看看!
    mianju
        38
    mianju  
       2018-01-07 22:47:22 +08:00
    要不试试智能问答的 AI 做辅助参考?比如图灵机器人什么的
    hebeiround
        39
    hebeiround  
       2018-01-07 23:59:46 +08:00
    mark 我觉得这种 APP 是一种好的趋势。
    linKnowEasy
        40
    linKnowEasy  
       2018-01-08 10:02:25 +08:00
    @chengzhoukun 试了一下这个链接的方法, 周末测试了一下. 发现 截图, ORC 识别,然后 Google 搜索, 出来, 还要自己看答案, 时间上来不及。感觉还是抓取题目的接口比较方便.
    而且存在 @geekcorn 所说的延迟问题. 就是给出的 10 秒倒计时. 在最后 1-2 秒内点击答案, 会算你没有答题。

    综上所述, 如果要做类似的项目, 个人感觉最合适的是抓取题目接口, 利用 google coustom search engine, 能提高成功率, 但不能保证 100 % 正确
    xiaomayi0323
        41
    xiaomayi0323  
       2018-01-09 15:45:38 +08:00
    @lloovve 我上一家公司,在 2012 年的时候,就把江苏卫视的非诚勿扰,搬到了手机上,同时可以开十几二十场,但到后面由于市场,玩法和技术的原因 GG 了
    qgbcs1
        42
    qgbcs1  
       2018-01-10 11:38:25 +08:00
    @geekcorn 墙内的就拜拜了
    qgbcs1
        43
    qgbcs1  
       2018-01-10 11:40:29 +08:00
    @geekcorn 下次 头条直接把题目接口改成图片的,看你怎么抓
    akura
        44
    akura  
       2018-01-10 12:02:29 +08:00
    @geekcorn 模拟登录认证怎么实现
    littleW2B
        45
    littleW2B  
       2018-01-10 14:09:31 +08:00
    http://secr.baidu.com/ ,百度简单搜索,可以直接语音。。
    wdwangsj
        46
    wdwangsj  
       2018-01-10 15:37:40 +08:00
    看了上面的答案,提取题目都耗时太长,我可以瞬间抓取题目和选项,然后通过固定链接自动打开百度搜索结果,总共耗时不到 1s,但是百度的搜索结果有时候不太尽人意,正在优化搜索结果,优化完成之后马上分享链接,尽情期待!!!!
    qgbcs1
        47
    qgbcs1  
       2018-01-10 17:07:42 +08:00
    @wdwangsj 求项目地址啊,
    zxartisan
        48
    zxartisan  
       2018-01-10 23:20:30 +08:00
    @geekcorn 大佬
    xiaomayi0323
        49
    xiaomayi0323  
       2018-01-11 14:28:31 +08:00
    @wdwangsj 求地址啊,我只想收集题目
    ahjsrhj
        50
    ahjsrhj  
       2018-01-11 15:09:15 +08:00
    @xiaomayi0323 #49 找台 root 的手机查看一下 /data/user/0/com.chongdingdahui.app/shared_prefs/spUtils.xml 这个文件,messageSocketUrl 里面保存的这个参数就是链接 messageSocketUrl
    完整的是{messageSocketUrl}+?sessionToken={apiToken}
    xiaomayi0323
        51
    xiaomayi0323  
       2018-01-11 15:16:45 +08:00
    @ahjsrhj 感谢,手头没有 android 手机
    ahjsrhj
        52
    ahjsrhj  
       2018-01-11 15:23:11 +08:00
    @xiaomayi0323 #51 因为 token 涉及到个人信息,所以没法直接公布,见谅,
    你直接用 socket 连接 http://lmsg.jiecaojingxuan.com:443 试试,不确定没有 token 是否可行
    wdwangsj
        53
    wdwangsj  
       2018-01-11 19:58:06 +08:00   ❤️ 3
    https://www.bainianaolai.com/Z/show/platform/toutiao
    终于写好了,电脑打开此链接,坐等问题出来,会自动刷新,秒搜,秒杀什么搜狗百度语音
    wdwangsj
        54
    wdwangsj  
       2018-01-11 19:59:18 +08:00
    下面有我回复的链接,电脑打开此链接,静静守候就可以了
    jossion12
        55
    jossion12  
       2018-01-12 10:17:45 +08:00
    前三道题一般都可以答对,有些题可能是两个答案里面不明确,有些是完全不知道答案,所有,如果有 81 台设备加复活卡就能跳过 5 道题,这是最差的情况,如果有些题知道两个答案,就能跳过跟多题。所有多台设备选择群控软件,然后每题根据概率分控应该是可以考虑的。(最好是人机配合)
    jossion12
        56
    jossion12  
       2018-01-12 11:11:37 +08:00
    @wdwangsj 牛了,你这压测没,一会就被挤爆了
    v1nce0t
        57
    v1nce0t  
       2018-01-12 23:11:15 +08:00
    @wdwangsj 请问是用哪个方法做到秒级抓取题目的 OCR 还是抓到了接口啊?
    benjunk
        58
    benjunk  
       2018-01-14 11:00:57 +08:00
    @wdwangsj 大佬发个源码呗,一起学习优化下
    diveinto
        59
    diveinto  
       2018-01-14 13:22:03 +08:00
    @wdwangsj 怎么做到的,之前冲顶大会有接口,现在不好使了
    sola97
        60
    sola97  
       2018-01-14 13:36:29 +08:00   ❤️ 2
    @diveinto #59 要重新抓包,接口地址换了,在 header 加上 Token 就可以请求题目了,13 点场实测可用
    diveinto
        61
    diveinto  
       2018-01-14 13:49:22 +08:00
    @sola97 cool, 我试试哈。不过我今儿 1 点场抓包,没看见有下发题目的请求了,不知道为啥
    sola97
        62
    sola97  
       2018-01-14 14:01:27 +08:00   ❤️ 2
    @diveinto #61
    header = {
    'X-Live-Session-Token': 'your token',
    'Content-Type': 'application/json',
    }
    resp = requests.get('http://msg.api.chongdingdahui.com/msg/current',headers=header)
    onlylovehuan
        63
    onlylovehuan  
       2018-01-14 14:38:08 +08:00
    @sola97 #62
    Token 怎么看呢大神
    sola97
        64
    sola97  
       2018-01-14 14:50:51 +08:00   ❤️ 1
    @onlylovehuan #63 APP 启动的时候拿 Packet Capture 抓一下请求,看到 header 有 X-Live-Session-Token 这个参数的拿来用就行了
    onlylovehuan
        65
    onlylovehuan  
       2018-01-14 15:22:24 +08:00
    @sola97 好的,谢谢大神
    现在是不是看不到,要等节目开始的时候才有?
    sola97
        66
    sola97  
       2018-01-14 15:40:30 +08:00   ❤️ 1
    @onlylovehuan #65 题目是节目开始才有,Token 是 APP 启动时获取用户、排行榜、直播信息时都会包含在 header 里,找找就有了
    onlylovehuan
        67
    onlylovehuan  
       2018-01-14 16:09:06 +08:00
    @sola97 格式是不是 1.6093295.652268.FCI.XXXX ………… 这样的?
    sola97
        68
    sola97  
       2018-01-14 16:21:04 +08:00   ❤️ 2
    @onlylovehuan #67 对的,可以试试用来获取用户信息,如果返回是登录状态,到时候拿题目也没问题了
    resp=requests.post('http://api.api.chongdingdahui.com/user/current', headers=header,data="{}")
    pzaicoding
        69
    pzaicoding  
       2018-01-14 18:56:38 +08:00
    大神 5 点场能用嘛?
    onlylovehuan
        70
    onlylovehuan  
       2018-01-14 21:01:30 +08:00
    @sola97 7 点场已经成功,感谢大神
    benjunk
        71
    benjunk  
       2018-01-14 21:17:07 +08:00
    @sola97 大佬,西瓜或者芝士抓过么
    sola97
        72
    sola97  
       2018-01-14 22:54:04 +08:00
    @benjunk #71 抓了下没抓到,找到了个芝士的接口可以遍历用户信息
    http://service.h7tuho5mf.cn/api/v1/homepage?uid=123
    Doodlister
        73
    Doodlister  
       2018-01-15 09:23:14 +08:00
    @sola97 大佬,,西瓜的模拟登陆能说一下怎么做么?我试了一下,流程大概是 填写手机号,向服务器请求发送验证码。然后填写验证码和手机号登陆。可是这一步 手机号 和 验证码都加密了。。所以无法登陆。。 然后我反编译了他的 app 一下。 发现好像是 rsa 加密的。。但我对这一方面 了解的不太多 = =。。 。。 所以 大佬有办法 能搞定这个加密规则 么?
    Doodlister
        74
    Doodlister  
       2018-01-15 09:24:04 +08:00
    @sola97 西瓜是头条的。。 抓了一下 头条系的 app 登陆使用的协议好像都差不多 。。 抖音也是用的这个加密算法
    benjunk
        75
    benjunk  
       2018-01-15 09:31:12 +08:00
    @sola97
    @Doodlister
    西瓜有人抓到了的,但是我去抓就没出来,两位大佬有兴趣试一试么
    jsnjfz
        76
    jsnjfz  
       2018-01-15 10:52:30 +08:00
    github 搜一下已经有好多了
    spin100
        77
    spin100  
       2018-01-15 12:50:03 +08:00
    0-0 芝士超人和西瓜视频的题目他是怎么获取得到的,抓了好多次,啥都抓不到
    sola97
        78
    sola97  
       2018-01-15 19:20:33 +08:00
    @spin100 #77 西瓜的我抓到了,没调用成功
    地址是这个 spe-frontier-b.snssdk.com/ws/v2
    User-Agent: WebSocket++/0.7.0
    sola97
        79
    sola97  
       2018-01-15 19:30:22 +08:00
    @Doodlister #73 所以说冲顶大会 app 做的烂就简单,刷邀请也是抓一下对接个验证码平台就搞定了,试着爆破了下登录的 4 验证码,真的成功登了几个帐号
    西瓜那个加密太多我也不会
    Doodlister
        80
    Doodlister  
       2018-01-15 20:14:07 +08:00 via Android
    @sola97 反编译了一下,已解开西瓜加密。。
    Doodlister
        81
    Doodlister  
       2018-01-15 20:16:45 +08:00 via Android   ❤️ 1
    @sola97。。 前几天 芝士超人的 邀请码接口甚至都没有做 登录认证。直接遍历一下 uid 就可以直接刷邀请码了 感觉这几个 app 就是为了抢热度 赶工出来的。 就西瓜做得还是比较正规。现在西瓜刷邀请码 还对设备做了限制,怎么破解我还得去研究研究
    xiaomayi0323
        82
    xiaomayi0323  
       2018-01-15 22:54:45 +08:00
    @Doodlister 厉害了,大神
    1711323390
        83
    1711323390  
       2018-01-15 23:38:16 +08:00
    西瓜的可以详细说一下吗谢谢您
    xiaomayi0323
        84
    xiaomayi0323  
       2018-01-15 23:39:37 +08:00
    @Doodlister 大神,我们建了一个答题技术群,有兴趣加入吗?
    Doodlister
        85
    Doodlister  
       2018-01-16 09:07:55 +08:00 via Android
    @xiaomayi0323 我不是啥大神,😂群号是啥。。
    spin100
        86
    spin100  
       2018-01-16 09:39:17 +08:00
    @wdwangsj 大佬有识别到的问题接口么
    xiaomayi0323
        87
    xiaomayi0323  
       2018-01-16 10:00:08 +08:00
    @Doodlister 给你的 outlook 邮箱发了
    spin100
        88
    spin100  
       2018-01-16 10:02:48 +08:00
    @sola97 Fiddler 没有抓取到,不知道大佬你是怎么抓的,,膜拜一下
    spin100
        89
    spin100  
       2018-01-16 10:05:28 +08:00
    @Doodlister 对,,群号多少
    ss63551234ss
        90
    ss63551234ss  
       2018-01-16 15:54:15 +08:00
    @sola97 请问大神,有现成的工具可以用吗?
    ss63551234ss
        91
    ss63551234ss  
       2018-01-16 16:59:12 +08:00
    @onlylovehuan 可以参考下代码吗。为何我把东西丢进去请求不到
    ss63551234ss
        92
    ss63551234ss  
       2018-01-16 17:02:34 +08:00
    @xiaomayi0323 发个群号给我。
    jiangker
        93
    jiangker  
       2018-01-16 18:26:08 +08:00
    同求群号 @xiaomayi0323
    RoyLaw
        94
    RoyLaw  
       2018-01-17 00:10:55 +08:00
    @Doodlister 西瓜反编译后这么容易看懂?明儿我也试试,目测西瓜用了 WS 来做持续加密通信,但愿搞点不复杂。
    z0011k
        95
    z0011k  
       2018-01-17 01:12:58 +08:00
    西瓜的下个低版本的可以抓到题目
    RoyLaw
        96
    RoyLaw  
       2018-01-17 09:15:43 +08:00
    @z0011k 有没有下载地址?似乎各个平台都会提供最新版下载
    c7k
        97
    c7k  
       2018-01-17 12:27:57 +08:00
    @xiaomayi0323 同求下群号
    manmuy
        98
    manmuy  
       2018-01-17 13:46:14 +08:00   ❤️ 1
    西瓜的加密。。。等于没加密

    =IF(A1=0,"35",IF(A1=1,"34",IF(A1=2,"37",IF(A1=3,"36",IF(A1=4,"31",IF(A1=5,"30",IF(A1=6,"33",IF(A1=7,"32",IF(A1=8,"3d",IF(A1=9,"3c"))))))))))
    spin100
        99
    spin100  
       2018-01-17 14:43:42 +08:00
    @manmuy 一脸蒙逼的我,,看不懂,,,@xiaomayi0323
    RoyLaw
        100
    RoyLaw  
       2018-01-17 17:00:35 +08:00
    @manmuy 看的晕死了哈哈
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5358 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 08:17 · PVG 16:17 · LAX 00:17 · JFK 03:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.