yangmiemie 最近的时间轴更新
yangmiemie

yangmiemie

V2EX 第 199276 号会员,加入于 2016-10-31 21:19:35 +08:00
yangmiemie 最近回复了
用 docker
希望你首先理解大数据的相关概念,要做这东西你最起码要知道这东西是什么,从 what,how 的角度去做,最后实现出来之后思考 why 才是你更上一个台阶的步骤。大数据无非就是两个基础部分,存储和计算。后续再利用机器学习,深度学习结合 TensorFlow 利用你的数据分析训练处一个模型,或者直接数据分析得到有价值的东西,能够帮助人们预测或者知道某件事情或者数据的走向。java 需要学习,毕竟主流的大数据工具 Hadoop 就是 java 搞的。第一阶段可以先了解 Hadoop 的体系结构、原理、编程,第二阶段需要知道 NoSQL 数据库是什么,然后学习一下 Hadoop 生态的 NoSql ( HDFS、MapReduce、HBase ),第三阶段就是去学习数据分析引擎了,Hadoop 生态的数据分析引擎 Hive、Pig 等。再者再去学习一下流引擎,如 Spark、Apache Storm 等。最后在学习一下现在流行的实行计算引擎 Apache Flink,以及处理消息队列的 kafka。如果只做数据分析的话 python 也是可以的,要学习 numpy 和 pandas 等等。视频资源网上一搜一大把,实在不行就去哔哩哔哩找。希望能帮助你。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1295 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 23:27 · PVG 07:27 · LAX 16:27 · JFK 19:27
Developed with CodeLauncher
♥ Do have faith in what you're doing.