Openshift运维
应用
部署
镜像同步(UAT->PRO)
应用部署配置New Project/New App
环境变量
cpu与内存资源限制
健康检查
复本数量
创建router
特殊Node节点绑定
pod的亲和与互斥
pod网速限速(特别是对外提供服务的pod)应用配置中心(gitlab)
更新
镜像同步
应用新版本部署监控
Pod EFK
Registry与Router等重要服务的监控
物理层
创建资源
负载均衡器
NAS存储
应用私有网络监控
vpc
负载均衡器
主机状态监控(CPU与内存)
集群层
备份
etcd全量备份
应用配置备份(Ark)
应用备份(oc export)集群版本管理
集群升级(每个大版本升级)
日志归档与清理
EFK日志清理
hawkular-cassandra日志清理
journal日志归档journalctl --vacuum-time=3days或者journalctl --vacuum-size=200M或者在/etc/systemd/journald.conf中设置日志大小
message日志归档Node节点管理
ansible脚本扩容
Node的隔离与恢复(关闭调度维护)资源管理
资源配置范围管理(LimitRange)
资源的配额管理
PV(Persistent Volumes)的创建
项目间的网络隔离监控告警
Heapster + Influxdb + Grafana 集群监控
统一的日志监控 EFK
Pod监控Restart数
Node节点资源使用情况(Limit + Request + Real)权限控制
管理员账号
运维人员账号Harbor私有镜像仓库的运维
镜像备份
高可用
可用性监控与告警
中间件层
Redis
RDB
Rabbitmq
FastDFS
作者:潘晓华Michael
链接:https://www.jianshu.com/p/e6b3600d250a