V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zhoudaiyu
V2EX  ›  Kubernetes

有几个关于 etcd 部署的问题想问问大家

  •  
  •   zhoudaiyu · 2021-06-11 10:44:01 +08:00 · 1922 次点击
    这是一个创建于 1267 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近发现 master 节点上的组件运行都不正常,最后查到了是磁盘 I/O 性能不行导致 etcd 落盘变慢从而影响了其他组件的运行。我们的 etcd 是运行在虚机机上的,可能有其他的机器 I/O 高影响了 etcd 的机器。

    有三个问题问问大家:

    1 、你们的 etcd 是运行在和其他 master 节点组件一起部署的吗?

    2 、etcd 是运行在虚机上还是物理机?如果是虚机的话会避免和其他虚机部署在同一个物理机吗?

    3 、etcd 的数据目录是单独挂盘吗?是机械硬盘还是 SSD 呢?因为我看了 etcd 官网是推荐 etcd 部署在 SSD 上的?

    7 条回复    2021-06-11 21:41:54 +08:00
    suifengdang666
        1
    suifengdang666  
       2021-06-11 11:02:34 +08:00
    其实很简单,看(资源)钱办事,你的项目有多重要,能拿到多少资源,决定了服务器性能的上限。如果上限已经明确,那就只能从软件层面尽力去优化了。
    zhoudaiyu
        2
    zhoudaiyu  
    OP
       2021-06-11 11:15:26 +08:00
    @suifengdang666 硬件资源在协调,软件上用了 etcd 官方推荐的 ionice 调整 etcd 的 io 优先级,从结果来看不是很明显
    huweic
        3
    huweic  
       2021-06-11 11:26:36 +08:00
    普通虚机,具体隔离性也看做的好不好吧,Master 节点会申请比较高一档的配置,ETCD 直接放在 Master 节点上,单独挂 SSD 给 ETCD 用,然后会禁止调度不跑普通任务
    asilin
        4
    asilin  
       2021-06-11 11:35:17 +08:00
    如果对可用性要求不高,可以调大"--snapshot-count" 参数的值,让数据尽量不落盘,减少磁盘 IO 。

    该值默认为 100000,kubernetes 为了安全起见,减小到了 10000,你可以设置为 100000 以上观察下效果。
    zhoudaiyu
        5
    zhoudaiyu  
    OP
       2021-06-11 12:37:17 +08:00 via iPhone
    @asilin 目前没有 SSD 资源了,虚机已经迁移到磁盘 IO 压力小的机器上了,但是还是不好使。您说的这个参数我试试,谢谢啦
    zhoudaiyu
        6
    zhoudaiyu  
    OP
       2021-06-11 12:38:09 +08:00 via iPhone
    @huweic 目前没有 SSD 了 QAQ,虚拟化用的 VMWARE 的我也不清楚具体咋做的
    zvcs
        7
    zvcs  
       2021-06-11 21:41:54 +08:00 via iPhone
    @zhoudaiyu 能上 ssd 更好。esxi 的磁盘 io 性能一直很尴尬
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2100 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 00:27 · PVG 08:27 · LAX 16:27 · JFK 19:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.