首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
fywf555
›
全部回复第 1 页 / 共 1 页
回复总数
3
2019-10-10 15:07:11 +08:00
回复了
fywf555
创建的主题
›
问与答
›
转行大数据,工作了大半年天天写 sql 的我该何去何从!
@
dawnchen123
先搭集群,搭集群尤其自己搭那是非常难,虚拟机不建议用。简化流程,你可以买百度的云主机,100 多点一台能用 1 年,有钱你买 3 台。
困难路线:
搭 3 台的土豪线路:每个主机安装一 hadoop,然后 3 台主机彼此之间做免密钥。这 3 台 hadoop 主机就可以看做一个整体。然后安装 zookeeper,spark。
然后点开 eclipse 或者其他什么软件,安装依赖,然后自己用代码生成数据集,之后用 scala 写一个脚本 rdd 转化流程。从数据集中读取数据,然后处理后落地 hadoop 文件夹中。rdd 具体写什么可以上网找找有没有相关题目。
测试没错后打包扔进去服务器。使用 spark 命令行进行启动,落地数据。
很有条件再上个 azkaba 调度器。
比较简单的线路:
搭一台线路:安装 hadoop,安 zookeeper,安装 spark,然后点开 sparkshell,把网上找来的代码复制粘贴到里面看看会发生什么。
很简单的线路:
上网找个教程,比如尚硅谷,然后跟着听课跟着做。人家水平不错的。
我推荐最后一种。
2019-10-10 12:24:08 +08:00
回复了
fywf555
创建的主题
›
问与答
›
转行大数据,工作了大半年天天写 sql 的我该何去何从!
@
locoz
谢老哥,关键怎么是不知道怎么深入啊,下一份工作能不能找到对口的我都不确定。我在网上随便看的,说把 spark 源码背下来就有底气了。我 spark 最多就是写 rdd 代码打包扔进服务器启动的水平,估计没啥竞争力。
2019-10-10 12:14:47 +08:00
回复了
fywf555
创建的主题
›
问与答
›
转行大数据,工作了大半年天天写 sql 的我该何去何从!
@
dawnchen123
培训的,简历造假写 3 年工作经验。我能隐约感觉你想问啥,关于自学不自学不要听别人胡扯,培训经历不可耻,学的不好才可耻,我学的很 happy,还认识不少人。
大学学的炼钢时候,顺便自学游戏设计,结果出来都骂我是野生程序员。外行转行就应该把假简历砸到人事的脸上,然后互相伤害。我上次找工作被人事揭穿后斗志斗勇一个星期,最后人事都对我的无赖表示钦佩。
在行内就只能自学了。。。
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
1081 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms ·
UTC 17:34
·
PVG 01:34
·
LAX 10:34
·
JFK 13:34
Developed with
CodeLauncher
♥ Do have faith in what you're doing.