V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
0xljh
V2EX  ›  程序员

大数据入门还需要学习 hadoop 吗?

  •  
  •   0xljh · 2022-03-06 17:29:40 +08:00 · 2565 次点击
    这是一个创建于 992 天前的主题,其中的信息可能已经有所发展或是发生改变。
    7 条回复    2022-03-07 21:58:49 +08:00
    staticor
        1
    staticor  
       2022-03-06 18:34:42 +08:00
    只学 SQL 也算“大数据入门”。

    只是不知道楼主对入门的定义是指什么。
    zhaoyeye
        2
    zhaoyeye  
       2022-03-06 18:35:52 +08:00 via Android
    大数据不是 Hadoop 为基础吗?
    sadhen
        3
    sadhen  
       2022-03-06 23:18:22 +08:00
    Hadoop 了解一下就可以了,实际上现在都是云上数仓,需要了解的是像 S3 这样的对象存储
    gosansam
        4
    gosansam  
       2022-03-07 09:49:02 +08:00
    现在大数据需要学什么呀 以前搞过 hadoop mapreduce spark 现在忘完了
    Camuscode
        5
    Camuscode  
       2022-03-07 14:18:47 +08:00
    学习一下吧 了解一些 hadoop 还是好的
    vincent7245
        6
    vincent7245  
       2022-03-07 15:17:52 +08:00   ❤️ 1
    就好比程序员入门需要学习 c++吗

    大数据开发 5 年的老鸟告诉你,必须学。虽然企业总已经不再适用 MR 了,但是 HDFS 作为大数据集群最基础的文件系统,Yarn 作为基础的任务调度系统,其他的比如 spark/flink 等都是跑在 yarn 上的 ,而且至今都没有替代品。

    其次,理解了 hadoop 的设计思想你才真的理解了大数据处理的基本思路。把 hdfs 和 yarn 的源码研究一遍,其他的框架你就能平趟了。
    0xljh
        7
    0xljh  
    OP
       2022-03-07 21:58:49 +08:00
    @vincent7245 谢谢老铁
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2812 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 07:10 · PVG 15:10 · LAX 23:10 · JFK 02:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.