工作内容
- 负责基于 Hadoop/Spark/Hbase/Storm/Alluxio 等分布式计算存储组件的大数据平台系统架构设计与实现,满足大数据平台 Batch/Interact/Streaming/Sophisticated 等各种场景的功能性 /非功能性需求;
- 负责大数据相关业务应用场景的,大数据平台相关技术方案设计与项目支持;
- 负责大数据平台计算存储层组件,BUG 修复 /功能&性能增强等相关二次开发;
- 负责大数据平台工具层面向用户的功能系统设计与开发实现;
- 大数据平台系统运营规范,及运营工具系统的设计与开发实现;
- 负责上述大数据平台相关系统的可用性、容量、性能、监控、发布、安全等运营管理工作,确保系统持续稳定、高效运行;
- 深入理解上述大数据平台组件 /系统,及其相关依赖组件 /系统架构与工作原理(如 Linux OS,MySQL DB 等),高效调优排障;
职位要求
- 熟悉 java/Scala/C/C++中的任意一门,熟悉 shell/python/perl 或其他脚本语言中的任意一门;有完整软件项目设计开发经验优先;
- 熟悉 Hadoop/Spark/Hbase/Storm/Greenplum/Alluxio 等分布式计算存储组件中的任意一个,并具备较强的调优排障能力;有相关二次开发经验优先;
- 熟悉服务器 /存储 /网络 /OS/中间件等基础架构基本元素,熟悉 linux 操作系统,具备较强的调优排障能力;熟悉 docker/kubernetes 者优先;
- 熟悉 Anaconda/Spark ML/Tensorflow 任意一个者优先;有机器学习平台建设 /应用开发项目经验者优先;
- 学历要求:本科或以上学历。
工作地点
深圳市南山区
加微信细聊(base64): NDkwNjM3NjUw 注明来自 V2EX