运维面试

devops 平台?(git规范、cmdb、项目编码统一生成、Jenkins、CICD、统一平台录入参数传到后面Jenkins、Jenkins打包回传CMDB
、打包镜像到Hub库、检查代码是否被修改、部署前后的执行动作、脚本检测进程有没有起来或zibes、Apollo、平台统一SQL执行权限(备份、执行、回滚)
) 打包不分环境,开发、测试、预发布由开发测试发,生产环境由运维。负责人确认后流转到下一个环境。
日志统一接入ELK:统一的日志框架、日志规范(格式、级别),一般保存3~6个月;
转维标准:部署目录、集群安装是否规范、代码与配置分离、日志目录和输出格式;
应用监控体系?
应用部署及回滚策略?
——生产确认?运维通过shell脚本检查服务的可用性,并通过shell脚本(或WebUI等其他方式)检测系统主要的API接口或URL地址;其他检测需要交给开发和测试完成;
——保留10个成功的版本备份,通过脚本自动回滚;或者选择回滚的版本再发布,jenkins不会再打包,而是在应用部署包的归档库里面,找到对应版本的部署包、配置文件、数据库脚本等,重新执行shell部署脚本,数据库一般不会轻易的回滚;
生产问题处理流程?
——对生产问题影响范围要达成共识(产品、开发、测试、运维几方),对P0级的问题几方要联动一起参与,其他级别的问题再分运维问题、研发问题,下发给对应具体人员或组织;
运维分组:
基础运维(网络、服务器硬件、云环境)、产品运维(各应用系统运维、发布、监控;数据库DBA、中间件)、客服运维、自动化运维(devops平台建设、批量改密码、批量端口开通、批量开权限、CICD自动化、台账等,使用 python 语言)、安全运维(网络安全、服务器安全、应用安全)
系统运维(中间件、网络、DBA等)、应用运维(应用高可用、自动化发布、日志采集、监控大屏)、安全运维、桌面运维