工作职责:
l 保证百度战略级新产品&业务的高可用,包括公有云、私有云、AI、无人车等;
l 制定运维规划,深入各运维技术子方向(故障 /容量 /变更等),提供平台化运维解决方案;
l 持续改善大规模分布式计算、存储集群的可靠性,提升运行效率;
l 高效管理百度海量机器资源,不断提升资源使用效率;
l 设计、开发高效运维平台与工具,持续提升运维效率;
职位要求:
l 计算机或相关专业本科以上学历,2 年以上互联网从业经验;
l 精通 Linux/Unix 环境,熟悉 linux 文件系统、内核、性能调优,TCP/IP、HTTP 等协议,熟练掌握 shell/php/python/perl/java 中任意一门语言,并且有良好的编程习惯;有良好的计算机和网络基础;
l 熟悉 OpenStack、kvm、lxc、docker、container 或其他虚拟化技术,有云系统相关研发或运维经验优先;
l 熟悉 HADOOP 生态,并能对平台 CPU/MEM/IO/网络 /调度中一个或多个方面的性能调优;熟悉数据仓库的 ETL 的开发和数据建模,有 Map Reduce 或其他并行计算的实践经验;
| 熟悉业界分布式计算系统,熟练掌握 mapreduce/spark/storm 中的任意一种,有 Map Reduce、Spark、Hive 或其他并行计算的实践经验
l 有大型互联网公司系统开发、测试、运维、应用工作经验者优先;
l 较好的问题分析与解决能力,较强的责任感。良好的沟通与协调能力。
联系人:
[email protected]