基本信息
文件名称:IT运维面试题及答案.docx
文件大小:27.5 KB
总页数:6 页
更新时间:2025-09-25
总字数:约4.57千字
文档摘要

IT运维面试题及答案

一、基础技能题(初级运维)

Linux系统中,如何查看某个进程占用的CPU、内存资源?如果要强制终止该进程,步骤是什么?

答案:

查看资源:先用psaux|grep进程名/进程ID找到目标进程,再用top-p进程ID实时查看CPU、内存占用(按P按CPU排序,M按内存排序),或用htop(更直观);也可通过pidstat-p进程ID1查看每秒资源变化。

强制终止:先尝试kill进程ID(发送终止信号,让进程清理资源),若进程无响应,用kill-9进程ID强制杀死(注意:强制终止可能导致进程数据丢失,需确认进程非核心服务,如数据库进程需先尝试正常关闭)。

服务器无法ping通网关,可能的原因有哪些?如何一步步排查?

答案:

排查步骤:

先查本地网络配置:ipaddr看网卡是否正常启用(有无IP地址、是否处于UP状态),cat/etc/sysconfig/network-scripts/ifcfg-eth0(CentOS)或/etc/netplan/*.yaml(Ubuntu)确认网关配置是否正确;

检查物理链路:看服务器网线是否插紧、交换机端口是否亮灯,可换网线/端口测试;

测试网关连通性:ping网关IP,若不通,用traceroute网关IP看卡在哪一跳,再登录网关设备(路由器/交换机)查端口是否放行该服务器IP、有无ACL规则限制;

检查本地防火墙:firewall-cmd--list-all(CentOS)或ufwstatus(Ubuntu),看是否禁止了ICMP协议(ping依赖ICMP),若有则临时放行firewall-cmd--add-protocol=icmp--permanent并重启防火墙。

二、核心故障处理题(中级运维)

线上服务器突然死机,重启后如何排查死机原因?

答案:

先查硬件日志:若服务器有IPMI/iDRAC接口,登录远程管理界面看硬件状态(CPU温度、内存故障、硬盘坏道),或查看本地硬件日志(/var/log/mcelog记录CPU/内存硬件错误,需安装mcelog工具);

查系统日志:cat/var/log/messages(CentOS)或/var/log/syslog(Ubuntu),重点看死机前的报错(如“Outofmemory”内存溢出、“IOerror”硬盘IO错误、“kernelpanic”内核崩溃);

查进程日志:若死机前有高负载进程,看对应服务日志(如Tomcat日志、数据库日志),是否有内存泄漏、死锁等问题;

查系统负载历史:若开启了sar工具,用sar-u110(历史CPU数据)、sar-r(内存数据)回溯死机前的负载情况,判断是否因CPU/内存耗尽导致死机。

MySQL数据库突然无法连接,可能的原因及排查步骤?

答案:

先查数据库进程:psaux|grepmysqld看进程是否存活,若未启动,查看启动日志cat/var/log/mysqld.log找报错(如配置文件错误、数据目录权限不足),尝试重启systemctlstartmysqld;

查端口监听:netstat-tulnp|grep3306或ss-tulnp|grep3306,看3306端口是否正常监听,若未监听,检查f配置文件中bind-address是否限制了IP(如设为则仅本地可连,需改为允许远程);

查权限与密码:用本地客户端mysql-u用户名-p测试登录,若提示“Accessdenied”,检查用户名密码是否正确、是否有远程登录权限(selectuser,hostfrommysql.user;,若无则执行grantallon*.*to用户名@%identifiedby密码;并刷新权限flushprivileges;);

查防火墙与安全组:服务器本地防火墙是否放行3306端口(firewall-cmd--list-ports),云服务器需检查安全组规则是否允许客户端IP访问3306端口。

三、工具与架构题(高级运维)

用Ansible批量管理100台服务器,如何实现“批量重启nginx服务并验证服务是否正常启动”?请写出核心playbook内容。

答案:

playbook(nginx_restart.yml)核心内容:

-name:批量重启nginx并验证服务状态

hosts:all#目标服务器组(在inventory文件中定义)

remote_user:root#远程登录用户

tasks: