职位描述
团队负责数百万节点的云原生基础设施,支撑公司的所有产品线。目前在 kubernetes 集群管控技术,运行时资源优化,多云多集群,云原生基础设施稳定性保障方面都会比较深入的技术积累,并且开源有 kubebrain, katalyst 等云原生基础技术相关项目,团队持续围绕以资源并池,资源弹性为中心的基础技术研发和突破。
岗位职责
- 构建超大规模的 kubernetes 集群,推进系统架构演化和设计,持续优化管控系统在大数据/ML 等场景下的性能和稳定性;
- 定义 kubernetes 集群的 SLO ,持续优化端到端的延迟,分析性能瓶颈,输出解决方案,并推动上线和落地;
- 持续构建和完善 kubernetes 集群的可观测性,提升问题定位效率,并且建立可观测性数据仓库,通过数据驱动的方式优化集群性能。
职位要求
- 具备扎实的计算机理论基础,有扎实的操作系统,体系结构,数据结构和算法功底;
- 精通 Go ,Python ,Rust ,C/C++ 等编程语言一个或多个;
- 对大规模分布式系统感兴趣,有分布式系统的实践经验,精通 kubernetes 系统更佳;
- 有好奇心,有技术热情,能自我驱动,喜欢钻研,具备良好的学习能力。
联系方式
rockuw[at]gmail.com