V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
MichaelYin
V2EX  ›  外包

[远程]Python 爬虫远程兼职

  •  1
     
  •   MichaelYin · 2015-02-02 12:01:40 +08:00 · 2814 次点击
    这是一个创建于 3583 天前的主题,其中的信息可能已经有所发展或是发生改变。
    这份工作适合什么样的人?
    这份工作适合于对Python有适当了解但是实际使用经验稍微欠缺的朋友,通过这份工作,你会对Py的一些常用库更加熟悉,比如re, urllib等,并且对于Py社区最流行的爬虫框架Scrapy的工作机制也会有更深入的了解,也会学会遵守Py相关编程规范比如pep8。

    能详细谈一下这份工作的具体内容么?
    这份工作主要是基于Python的Scrapy框架针对特定的网站编写数据抓取的爬虫,我们会提供一个样板爬虫的源代码,你所要用到的大部分技术都会在这个源代码里面找到,你所需要做的就是理解它如何工作并且针对其他网站编写相应的爬虫。预计每周工作时间在25小时左右,薪水的话是按单个爬虫单独算价格,交付件是爬虫源代码和抓取的数据

    这份工作是有报酬的么?
    我们希望你通过这份工作技术上有所增长,也能在金钱上有所收获,大家通过这种合作达到共赢

    这份工作有长期合作的可能性么?
    我们希望能在这里找到可以长期合作的伙伴

    如果有对这份工作有兴趣的朋友,欢迎在这个帖子后面留下你的联系方式,如果同时能留下github以及博客地址那样就更棒了,我会在稍后尽快联系你,谢谢。
    77 条回复    2015-02-12 19:07:29 +08:00
    tremblingblue
        1
    tremblingblue  
       2015-02-02 12:06:53 +08:00
    simplemx#126.com
    simplemx.github.io
    https://github.com/simplemx
    回头一看github以及日志已长草- -
    ericls
        2
    ericls  
       2015-02-02 12:21:21 +08:00 via Android
    dustet谷歌邮件
    其他在个人资料页
    n37r06u3
        3
    n37r06u3  
       2015-02-02 12:24:35 +08:00
    joshryo
        4
    joshryo  
       2015-02-02 12:24:41 +08:00
    joshryo AT gmail dot com
    unionx
        5
    unionx  
       2015-02-02 12:26:22 +08:00
    unionx AT foxmail DOT com

    https://github.com/unionx
    Phant0m
        6
    Phant0m  
       2015-02-02 12:27:01 +08:00
    unixsafe#foxmail.com
    baka
        7
    baka  
       2015-02-02 12:29:12 +08:00
    endless
        8
    endless  
       2015-02-02 12:34:48 +08:00
    xavierskip
        9
    xavierskip  
       2015-02-02 12:38:56 +08:00
    [id] at gmail

    资料在我首页
    leoYu
        10
    leoYu  
       2015-02-02 12:39:05 +08:00
    binux
        11
    binux  
       2015-02-02 12:41:51 +08:00   ❤️ 1
    来用 pyspider 吧,更强大的脚本管理和调度策略,直接远程 WEB 页面上开发。
    Draplater
        12
    Draplater  
       2015-02-02 12:43:42 +08:00 via Android
    [email protected]
    在校学生,写过几个爬虫,无工作经验
    tjxiter
        13
    tjxiter  
       2015-02-02 12:46:19 +08:00
    [email protected]
    写过网络爬虫抓取网页keywords和tags。
    xTheo
        14
    xTheo  
       2015-02-02 12:48:38 +08:00
    me at xtheo.com
    自我评价水平一般,没有github的repo.
    手头捣鼓(过)的东西大概有:
    1.openwrt的定制,用于fxxk gfw,小规模使用中
    2.一个golang写的用于虚拟物品的CRM系统.小规模使用中.
    3.一些自用的简单的radius命令行工具
    endoffight
        15
    endoffight  
       2015-02-02 12:48:38 +08:00 via Android
    有兴趣,有经验

    endoffight#gmail.com
    jmania
        16
    jmania  
       2015-02-02 12:53:31 +08:00
    id [AT]live . com
    爬过一些网站...
    wenLiangcan
        17
    wenLiangcan  
       2015-02-02 12:54:55 +08:00
    渣渣也想争取一下

    wenLiangcan#gmail.com

    github.com/wenLiangcan
    walleL
        18
    walleL  
       2015-02-02 12:55:37 +08:00
    https://github.com/jinxingxing

    有兴趣, 工作中会用 Python 做一些工具
    Sylv
        19
    Sylv  
       2015-02-02 12:58:55 +08:00
    su.m.m.xt#gmail.com
    lll9p
        20
    lll9p  
       2015-02-02 13:05:39 +08:00
    很感兴趣,留个Email lll9p.china#谷歌。
    hjkl0001
        21
    hjkl0001  
       2015-02-02 13:12:58 +08:00
    先备注吧。。。呜呜
    Zkiller
        22
    Zkiller  
       2015-02-02 13:21:01 +08:00
    学生党实习中前来留名地址:google邮箱: pengthx.kiss
    prowayne
        23
    prowayne  
       2015-02-02 13:22:10 +08:00
    也感兴趣, blog.prowayne.com. github,bitbucket(用的多,私有库).
    爬过各种博客,等等
    lynnworld
        24
    lynnworld  
       2015-02-02 13:22:54 +08:00
    mark ,python 新手可以么,不坑. https://github.com/Lynnworld
    leihao
        25
    leihao  
       2015-02-02 13:52:45 +08:00
    玩儿过scrapy
    抓过zhihu.com和acm.nyist.net两个网站

    希望长久合作,不玩github,个人博客就不贴了,绝对靠谱,期待合作。

    adleihao AT outlook.com
    ZOwl
        26
    ZOwl  
       2015-02-02 14:01:56 +08:00
    zhhbug AT gmail

    https://github.com/ZOwl

    感兴趣。爬过比较麻烦的网站,需要登录、多次交互、处理编码和AJAX取多页内容等,也爬过简单的,如从RSS入口爬新闻站等。对Scrapy还算比较熟吧。
    egrcc
        27
    egrcc  
       2015-02-02 14:09:20 +08:00
    zhaolujun1994#gmail.com
    搞过爬虫,项目请见github,不过没有工作经验

    github: https://github.com/egrcc
    DannyVim
        28
    DannyVim  
       2015-02-02 14:14:12 +08:00
    vedacode在谷歌邮箱

    Github: https://github.com/DannyVim

    在校生,没有工作经验
    blackbbc
        29
    blackbbc  
       2015-02-02 14:27:30 +08:00
    505968815#qq.com
    Github: https://github.com/blackbbc
    博客: sweetll.me
    用pyspider写过爬虫: http://pyspider.sweetll.me/
    大二学生 无工作经验 寒假没事做 求 QAQ
    chevalier
        30
    chevalier  
       2015-02-02 14:31:09 +08:00
    [email protected]
    有半年多爬虫工作经验,2年Python经验
    shencenn
        31
    shencenn  
       2015-02-02 14:40:33 +08:00
    zhoucencl [AT] gamil [.] com

    有大型网站抓取经验。link数超3亿。目标页面超9000w。
    jihaiming
        32
    jihaiming  
       2015-02-02 15:04:41 +08:00
    嗯, 如果真像描述写的确实双赢...
    我的mail:
    jihaiming.net [at] gmail dot com
    vulgur
        33
    vulgur  
       2015-02-02 15:06:27 +08:00
    enener
        34
    enener  
       2015-02-02 15:07:22 +08:00 via Android
    。。。。看教程学会再来
    hazard
        35
    hazard  
       2015-02-02 15:09:36 +08:00
    wolong at vip.qq.com
    希望能有机会!
    vanxuing
        36
    vanxuing  
       2015-02-02 15:10:33 +08:00
    没做过py项目,但是很感兴趣了,可以尝试么?
    fullfuture#sina.cn
    z11148
        37
    z11148  
       2015-02-02 15:26:20 +08:00
    .....卤煮的头像。。。。
    durrrr
        38
    durrrr  
       2015-02-02 15:32:19 +08:00 via iPad
    不知 lz 需要招多少人?
    两年 web 开发,一年 python 使用经验。为人做事非常靠谱。抓包、翻源码已成本能。
    希望能与 lz 合作。

    ihaku4 AT gmail.com
    github.com/ihaku4
    hitluobin
        39
    hitluobin  
       2015-02-02 16:04:03 +08:00
    [email protected]
    学校期间写过爬虫,现阶段使用Python,希望可以通过该项目证明自己。
    bbking
        40
    bbking  
       2015-02-02 16:20:55 +08:00
    [email protected]
    cnblogs.com/chenbjin
    新手,只为学习而来。
    MrGba2z
        41
    MrGba2z  
       2015-02-02 16:27:34 +08:00 via iPhone
    我去这么多人。。。。。
    那我就算了。。。
    simpleliang
        42
    simpleliang  
       2015-02-02 16:31:54 +08:00
    对python和兼职都感兴趣
    https://github.com/liangjingyang
    simple.continue#谷歌.com
    exuxu
        43
    exuxu  
       2015-02-02 16:40:57 +08:00
    EXUXU50 DOT GMAIL DOT  COM
    http://blog.chinaunix.net/uid/26750788/abstract/1.html 不怎么用github,用wiz
    20150517
        44
    20150517  
       2015-02-02 16:41:12 +08:00 via Android
    这么多人?借宝地喊一句,有人一起开发python项目吗?也是看爬虫相关,没报酬,大家写着玩的,但说不定能赚钱,有人有兴趣吗?
    RitzoneX
        45
    RitzoneX  
       2015-02-02 16:48:31 +08:00
    zxy
        46
    zxy  
       2015-02-02 16:59:33 +08:00
    收藏起来,等我觉得能来了,再附上
    imlonghao
        47
    imlonghao  
       2015-02-02 17:03:59 +08:00 via Android
    赞@binux 的pyspider
    我的爬虫数据分析站

    https://esd.cc
    目前在爬v2ex
    vilison
        48
    vilison  
       2015-02-02 17:06:01 +08:00
    d.vilison#gmail.com
    cwyalpha
        49
    cwyalpha  
       2015-02-02 17:22:17 +08:00 via iPhone
    hulalalala
        50
    hulalalala  
       2015-02-02 17:38:57 +08:00
    我的基特哈勃: https://github.com/gitovers
    我的博客: http://my.oschina.net/u/1454298
    本人目前大三,有python django开发经验,对爬虫很感兴趣,基本满足楼主各种条件XD,很希望能合作共赢呢!:P
    之前爬过一点点小网站,但纯粹是练手只用,没有用到实际作用里来,也算是有点基础吧。
    希望注意到我,联系邮箱:yjatts@163.com 使用时需要将@符号替换 :)
    voyager
        51
    voyager  
       2015-02-02 17:56:32 +08:00
    [email protected]


    github:https://github.com/cderek

    blog:http://www.chengeek.com/

    还是学生,还在学习,技术渣,
    PotatoBrother
        52
    PotatoBrother  
       2015-02-02 19:04:37 +08:00
    高中生来凑个热闹

    邮箱:ghzpotato#gmail.com
    GitHub: https://github.com/JmPotato
    Blog: http://ipotato.me/
    suddenly
        53
    suddenly  
       2015-02-02 19:24:22 +08:00
    [email protected]
    技术渣,没有github没有博客,python写过超简单的后台接口,试过django,flask,最后用了bottle(因为简单)
    没写过爬虫,了解re,主要为了学习,无奈不好找合适的项目练手
    frankzeng
        54
    frankzeng  
       2015-02-02 19:25:07 +08:00 via Android
    [email protected]
    爬过几大互联网公司的职位。
    arnofeng
        55
    arnofeng  
       2015-02-02 19:30:56 +08:00 via Android
    @20150517 有,联系方式fenglinhappy g妹儿
    wangfeng3769
        56
    wangfeng3769  
       2015-02-02 19:46:56 +08:00
    爬污水项目的是不是
    zhu327
        57
    zhu327  
       2015-02-02 21:30:44 +08:00
    https://github.com/zhu327

    没爬虫过,有兴趣,lxml弄过
    sandideas
        61
    sandideas  
       2015-02-02 23:11:32 +08:00 via Android
    @20150517 什么都不会的可以偷偷跟着学么。。
    nan0kai
        62
    nan0kai  
       2015-02-02 23:26:16 +08:00
    用户名 在 163。com

    比较感兴趣,只图学习点PY技术,或是交些相同爱好的伙伴
    WKPlus
        63
    WKPlus  
       2015-02-02 23:47:04 +08:00
    WhyLiam
        64
    WhyLiam  
       2015-02-03 03:23:16 +08:00
    wukongkong
        65
    wukongkong  
       2015-02-03 09:25:51 +08:00
    [email protected]

    有一定linux基础。
    博客已废。

    正在自学python。
    希望有机会实践一下自己的python。

    很感兴趣,麻烦发个邮件,让我尝试一下~
    Rabbit52
        66
    Rabbit52  
       2015-02-03 10:23:00 +08:00
    [email protected]
    http://rabbit52.com/
    https://github.com/Rabbit52

    scrapy 经验丰富,写过很多定制爬虫
    vigoss
        67
    vigoss  
       2015-02-03 10:24:06 +08:00
    多年开发经验,熟练使用scrapy,定向爬虫经验丰富,时间充裕。

    邮箱[email protected]
    maxmilia
        68
    maxmilia  
       2015-02-03 10:58:14 +08:00
    @MichaelYin
    maxmilia.zhang

    自学python一段时间了,有充足的时间与热情,了解pep8规范

    E-mail:maxmilia.zhang#gmail.com
    github: https://github.com/maxmilia
    Lumuy
        69
    Lumuy  
       2015-02-03 14:41:39 +08:00
    [email protected]

    同自学python一段时间
    egrcc
        70
    egrcc  
       2015-02-03 20:10:50 +08:00
    @20150517 有兴趣,请联系我。 zhaolujun1994#gmail.com
    CarlWangCn
        71
    CarlWangCn  
       2015-02-03 20:42:58 +08:00
    爬网站数据,容易被拉黑IP
    xohozu
        72
    xohozu  
       2015-02-04 09:56:54 +08:00
    @20150517 目前开源的爬虫项目已经很多了,感觉意义不是很大。
    20150517
        73
    20150517  
       2015-02-04 17:26:40 +08:00 via Android
    @xohozu 大哥,我又没说写开源爬虫项目。。。
    fityme
        74
    fityme  
       2015-02-06 18:14:06 +08:00
    imfity gmai.com
    github: fity
    已经废掉了的gitcafe博客在 http://fity.gitcafe.io/
    xohozu
        75
    xohozu  
       2015-02-07 20:52:31 +08:00
    @20150517 额,理解错了。私聊?
    MichaelYin
        76
    MichaelYin  
    OP
       2015-02-10 10:29:54 +08:00
    @endless @Draplater @egrcc @DannyVim @blackbbc @hulalalala @voyager
    由于有朋友说一直忘记查看邮箱,所以请收到消息的这几位朋友查看你在这个帖子下面留下的邮箱收件箱以获取进一步的消息,谢谢
    oldream
        77
    oldream  
       2015-02-12 19:07:29 +08:00
    借楼主的宝地,搭个车同求爬虫大牛:

    @tremblingblue
    @xavierskip
    @Rabbit52
    @vigoss
    @Rabbit52
    @WhyLiam
    @WKPlus
    @xohozu
    @frankzeng
    @hulalalala
    @imlonghao
    @hitluobin
    @chevalier
    @shencenn
    @ZOwl
    @leihao


    几位大拿,麻烦移步看看是否有意: http://www.v2ex.com/t/170551#reply0
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5990 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 03:02 · PVG 11:02 · LAX 19:02 · JFK 22:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.