葵海数字
XXX互联网公司运维治理及应急制度
2025年10月
-
-1-
名目
1、总则 0
2、运维工程师工作职责 0
、负责平台运维和技术支持 0
、平台信息和技术安全 1
\l“_TOC_250015“3、运维效劳治理体系 1
\l“_TOC_250014“运维效劳治理对象 1
\l“_TOC_250013“应急大事治理 2
\l“_TOC_250012“配置治理 2
\l“_TOC_250011“4、运维效劳内容 3
\l“_TOC_250010“效劳目标 3
\l“_TOC_250009“IT资产统计效劳 3
\l“_TOC_250008“网络、安全系统运维效劳 3
\l“_TOC_250007“主机、存储系统运维效劳 4
\l“_TOC_250006“数据库系统运维效劳 5
\l“_TOC_250005“中间件运维效劳 5
\l“_TOC_250004“终端、外设运维效劳 6
\l“_TOC_250003“5、应急效劳响应措施 6
\l“_TOC_250002“应急预案实施根本流程 7
\l“_TOC_250001“突发大事应急策略 7
突发大事响应流程 8
密码治理及处理流程 8
\l“_TOC_250000“6、运维响应时间 9
葵海数字
1、总则
第一条为保障XXX平台系统软硬件设备的安全平稳的运行,特制订本制度。
其次条运维工作总体目标:平台的安全平稳运行,日常维护工作的有序治理,突发大事的应急处理。运维治理制度的适用范围:全体运维人员。
2、运维工程师工作职责
2.1、负责平台运维和技术支持
〔一〕依据平台运营战略和目标,负责运维整体架构、安全防护、三方系统等运维方案制定,保障平台技术的安全、稳定。
〔二〕平台效劳器和安全效劳的购置拟定,包括选购数量、品牌规格、技术参数。
〔三〕平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。
〔四〕负责平台效劳器设备及系统密码口令的设置和保存,密码口令设置后报技术负责人,密码口令设定后任何人不得随便更改,保密口令每季度更一次,并严禁发送给第三方。
〔五〕负责平台系统测试环境,预生产环境,生产环境的代码公布,工程部署。
〔六〕云效劳器的年度预算制作,云效劳器的按时续费。
〔七〕平台域名的购置,备案,续费。
-
-1-
〔八〕域名加密证书的购置,部署,续费。2.2、平台信息和技术安全
〔一〕落实平台信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。
(二)负责防火墙定期维护和购置,在效劳器上做好病毒防护,进展硬件和技术双保护,确保平台不受病毒入侵和恶意攻击。
〔三〕7*24小时监控平台运行状况,遇到效劳器报警要第一时间上报技术负责人,并作出相应应对处理。
〔四〕建立多种备份机制,一旦主系统遇到故障或受到攻击导致不能正常运行,可以在最短的时间内替换主系统供给效劳。
〔五〕建立平台运维和开发集中式权限治理,依据岗位职责设定人员操作权限,针对不同应用系统、终端、操作人员,设置数据库的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏密码。
3、运维效劳治理体系
运维效劳治理对象
运维治理对象包括平台根底设施、应用系统、操作用户以及运维人员,具体内容如下:
根底设施包括效劳器网络架构、主机系统、存储系统、备份系统、终端用户、安全系统、以及机房环境〔IDC机房和云效劳器环境〕等。
-
-7-
应用系统包括XXX测试环境,XXX预生产环境、XXX生产环境、效劳器操作系统、防火墙、安全效劳等。
用户包括使用如上应用系统的治理用户及操作用户。
运维人员包括内部参与运维活动的相关部门和人员,以及供给技术支持效劳的三方公司和相关人员。
应急大事治理
应急大事治理流程的主要目标是尽快恢复效劳,供给并削减其对业务的不利影响,尽可能保证最好的效劳质量和可用性等级。应急大事治理流程通常涉及大事的检测和记录、大事的分类和支持、大事的调查和诊断、大事的解决和恢复以及大事的关闭。
配置治理
配置治理流程负责核实根底设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;确保配置治理数据记录能够准确地反映现存配置项的实际版本及状态。
配置治理实际上是全部资源的统一治理的功能,包括资源整个生命周期的参数或配置的变化记录的治理。治理信息主要涉及分类、型号、版本、位置,状态、相关资料等根本信息还包括核心参数等。
4、运维效劳内容
效劳目标
运维组供给的运行维护效劳包括,平台系统相关的主机设备、操作系统、数据库和存储设备的运行维护效劳,保