V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
781931641
V2EX  ›  程序员

请教下各位我这水平怎么入门大数据啊,目标是一年后能写个辣鸡论文毕业就行=W=

  •  
  •   781931641 · 2019-07-06 10:21:24 +08:00 · 3700 次点击
    这是一个创建于 1995 天前的主题,其中的信息可能已经有所发展或是发生改变。

    首先我很菜,现在的话是自己在学 python 搞搞机器学习,爬虫什么的。结果导师突然叫我做大数据,但是我这方面毛都不会,想着去看看系统性学习的视频但是没什么时间了(年底就开题了),直接啃书的话有推荐书籍吗(最好 python 的,java 的话只能说是学过。。。),或者各位诸位有什么其他学习途径推荐吗。成功毕业了致谢里面一定谢谢各位

    9 条回复    2019-07-06 16:35:18 +08:00
    terencelau
        1
    terencelau  
       2019-07-06 10:49:38 +08:00
    做大数据就是提取庞大数据中的核心价值,然后机器学习、数据挖掘、深度学习这些都是处理数据的方法(获取核心价值的方法)而且之间方法有不小的共通性。
    enaxm
        2
    enaxm  
       2019-07-06 11:13:22 +08:00
    入门容易,你想专业从事的话肯定搞不了

    入门看林子雨的书、教程什么的
    之后搭个简单的画像系统就行,参考下面这贴,这哥们只用了一周:

    http://www.voidcn.com/article/p-esoabbfy-brr.html
    enaxm
        3
    enaxm  
       2019-07-06 11:19:13 +08:00
    学习路径的话你可以先去牛客找找,不过从我的经验上来看,网上说的路线都比较片面,缺乏系统性。不过对你搞个毕设肯定是够了。
    最近没大有时间,你问的足够细的话我可能解答一下。

    https://www.nowcoder.com/discuss/41091

    https://www.nowcoder.com/discuss/120918
    yangmiemie
        4
    yangmiemie  
       2019-07-06 11:22:49 +08:00   ❤️ 1
    希望你首先理解大数据的相关概念,要做这东西你最起码要知道这东西是什么,从 what,how 的角度去做,最后实现出来之后思考 why 才是你更上一个台阶的步骤。大数据无非就是两个基础部分,存储和计算。后续再利用机器学习,深度学习结合 TensorFlow 利用你的数据分析训练处一个模型,或者直接数据分析得到有价值的东西,能够帮助人们预测或者知道某件事情或者数据的走向。java 需要学习,毕竟主流的大数据工具 Hadoop 就是 java 搞的。第一阶段可以先了解 Hadoop 的体系结构、原理、编程,第二阶段需要知道 NoSQL 数据库是什么,然后学习一下 Hadoop 生态的 NoSql ( HDFS、MapReduce、HBase ),第三阶段就是去学习数据分析引擎了,Hadoop 生态的数据分析引擎 Hive、Pig 等。再者再去学习一下流引擎,如 Spark、Apache Storm 等。最后在学习一下现在流行的实行计算引擎 Apache Flink,以及处理消息队列的 kafka。如果只做数据分析的话 python 也是可以的,要学习 numpy 和 pandas 等等。视频资源网上一搜一大把,实在不行就去哔哩哔哩找。希望能帮助你。
    danshendog
        5
    danshendog  
       2019-07-06 12:40:28 +08:00 via iPhone   ❤️ 1
    不知道你是本科还是硕士...
    若是本科的话,除非真的是很厉害的学校否则毕设都是想不过都难吧……
    ljpCN
        6
    ljpCN  
       2019-07-06 14:27:23 +08:00 via Android
    啃论文,善用 google scholar 以及 ieee 和 ACM 等等出版社的电子论文库
    ljpCN
        7
    ljpCN  
       2019-07-06 14:27:43 +08:00 via Android
    @ljpCN 加一个 dblp
    iyaozhen
        8
    iyaozhen  
       2019-07-06 16:32:43 +08:00
    大数据的话还是得 java,绕不开。

    话说大数据不都是几年前风口吗?你们导师怎么开 dao 车。现在完善的教程还是很多的,是在不行就买网课
    qq544230987
        9
    qq544230987  
       2019-07-06 16:35:18 +08:00
    毕业,应该简单吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2809 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 03:05 · PVG 11:05 · LAX 19:05 · JFK 22:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.