数据中⼼运维服务⽅案⽂档编制序号:[KK8UY-LL9IO69-TTO6M3-MTOL-FTT688]数据中⼼机房及信息化终端设备维护⽅案⼀、概况
xxx客户数据中⼼机房于XX年投⼊使⽤,⽬前即将过保和需要续保运维的设备清单如下:
另外,全院⽹络交换机设备使⽤年限较长,已全部过保,存在⼀定的安全隐患。⼆、维保的意义
通过机房设备维护保养可以提⾼设备的使⽤寿命,降低设备出现故障的概率,避免重特⼤事故发⽣,避免不必要的经济损失。设备故障时,可提供快速的备件供应,技术⽀持,故障处理等服务。
通过系统的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态,提⾼系统的安全性,做到为客户排忧解难,减少客户⼈⼒、物⼒投⼊的成本。为机房内各系统及设备的正常运⾏提供安全保障。可延迟客户设备的淘汰时间,使可⽤价值最⼤化。
通过引⼊专业的维护公司,可以将客户管理⼈员从⽇常需要完成专业性很强的维护保养⼯作中出来,提升客户的⼯作效率,更好的发挥信息或科技部门的⾃⾝职能。
通过专业的维护,将机房内各设备的运⾏数据进⾏整理,进⾏数据分析,给客户的机房基础设施建设、管理和投⼊提供依据。三、维护范围
1、数据中⼼供配电系统2、数据中⼼信息化系统3、全院信息化终端设备
4、数据库及虚拟化系统四、提供的服务
为更好的服务好客户,确实按质按量的对设备进⾏维护;我公司根据国家相关标准及⼚商维护标准,结合⾃⾝多年经验积累和客户需求,制定了⼀套⾃有的服务内容:
1、我公司在本地储备相应设备的备品备件,确保在系统出现故障时,及时免费更换新的器件,保障设备使⽤安全。
2.我公司和客户建⽴24⼩时联络机制,同时指定⼀名负责⼈与使⽤⽅
保持沟通,确保7*24⼩时都可靠联系到⼯程技术⼈员,所有节⽇都照此标准执⾏。3.快速进⾏故障抢修:故障服务响应时间不多于30分钟,2⼩时内⾄少2⼈以上携带相关⼯具、仪器到达故障现场,直到设备恢复正常运⾏。4.我公司对维修维护的设施设备的使⽤性能负责,在维修维护过程中
严格执⾏技术规范,保证设施设备的性能符合相关技术标准要求。在维修维护间,我⽅应对设施设备可能存在的故障隐患做出评估,并进⾏恰当的预防性处理,以保证设施设备的安全运⾏。若故障隐患超出维修维护范围的,及时书⾯通知客户,并提出消除隐患建议。
5.维护巡检中我公司提供设备系统图或使⽤说明书:将机房内设备的整个系统等汇编成资料,由维护⼈员进⾏统⼀放置,便于应急查询。6.巡检次数每年不少于四次,每次巡检后,由维修维护⽅提供巡检报
告,并由使⽤⽅签字确认。每⽉由我公司客户服务⼈员定期进⾏回访,听取客户意见反馈,搭建起双⽅的沟通渠道。7.提供系统应急⽅案:设备在12⼩时内还⽆法修复的应有备份应急处理⽅案。如提供适合负载功率的备机、备⽤空调等。
8.培训:提供专业理论知识培训和操作培训,维修维护培训,简单故障处理培训,培训⽂档由我公司整理。
9.⼈员配置:全年(包括所有的节假⽇期间)提供不少于2名⼯程师在
常住昆明本地,确保满⾜响应时间要求;到现场的维护维修⼯程师⾄少⼀名是能完全解决故障并有丰富从业经验的。10.我公司每次巡检完毕后提供维护报告,同进还提供全年维护报告、
每次维修事故报告等资料,根据事故提出相应的整体解决⽅案等管理规划层⾯的内容。11、数据分析:我公司将每次巡检、维修等数据进⾏整理,对设备运
⾏的数据变化量进⾏测数,给客户提供⼀份报告,系统性的介绍机房发⽣的变化,给客户后期系统建设、投资提供参考依据。12、提供系统相关的技术服务:设备搬迁、系统现场保障、突发或特殊应急处置。
13. 我公司对客户的服务采⽤⾃有的软件进⾏管理,实现包括资产管理、数据管理、合同执⾏管理等内容;所有事件有迹可查,管理流程化。此软件中的数据对客户开放。五、服务内容
(⼀)UPS供配电系统:(全包备件)1、供配电:
(1) 输⼊输出配电柜及线缆:测量输⼊输出开关、线缆载流量的实际值和UPS显⽰值的区别。线缆外观有⽆破损,线缆交叉的
情况,连接点的温度是否正常。
(2) 线缆是否存在局部过热, 通风是否良好。2、UPS主机:(全包备件)
(1)全包备件保修⽅式(保修期内设备的维护保养、故障维修所需的备件均免费维修更换)。(2)每3个⽉进⾏⼀次保养维护检查,内容如下:
1)外观检查:⾯板显⽰、案件、指⽰灯、风扇运⾏是否正常;2)设备内部电感、电解电容和功率线的外观检查;3)设备内部各功率部件及电路板信号线的物理连接检查;4)检查模块、电路板、轨导、连接端⼦的键是否出现氧化;5)检查设备清洁程度,特别是设备内部的积尘及其他物质;6)设备绝缘检查;
7)设备运⾏环境检查:设备通风及散热是否良好、环境温度、设备有⽆⽔患可能;
8)UPS运⾏参数的检查:整流器、逆变器、静态旁路、负载运⾏参数是否正常、检测值与实际测量值是否有偏差(不超过5%)。9)检查所有的电源保险丝、隔离开关的完好程度及是否安装牢固。10)每季度定期检测UPS输⼊线电压、输⼊频率、输⼊电流谐波成分、输⼊功率因数、效率、输出相电压、输出频率、输出⽕线-零线波形、蓄电池充电电流等参数,应符合相关国家要求。
11)对每台UPS电池组进⾏不低于电池容量50%的放电测试,并对每台
UPS电池组电池内阻进⾏检测,查看直流熔断器和蓄电池连接条的压降或温升是否有异常变化。
(4)每年定期⽤真空吸尘器清扫UPS主机内的各部件或⽤提供低压空⽓流吹风机来清除外来的残渣和灰尘。
(5)对UPS主机风扇定期进⾏逐步更换,每年更换量不少于总量的20%。运⾏5年以后逐步更换滤波电容。定期巡检尽量以观察、测量为主,减少停机。
(6)提供《客户现场服务报告》,报告需要客户签字认可。3、蓄电池维护(不包配件):(1)电池⽬检项⽬
电池外观检查:外观是否变形、渗漏,安全阀周围有⽆液体;电池端柱是否有腐蚀、爬酸现象或有过热痕迹;电池槽和盖的损坏;电池绝缘检查;
电池寿命:当电池达到使⽤年限时,提前通知⽤户;电池电压测量:检查充电电压是否和电池数量相匹配;电池端⼦连接是否稳固。视情况进⾏电池表灰尘处理。(2)仪器测量
测量和记录电池系统的直流浮充电压,此时也可选择测量和记录交流皱波电压测量每⼀个电池端柱与接地间的直流电压以发现不正常的接地测量和记录取样电池的温度测量和记录每个电池的浮充电压测量和记录系统均衡充电电压(3)UPS主机内部进⾏电池⾃检电池接触器闭合;电池处于浮充状态;整流、逆变通讯正常;电池状态正常;整流器⼯作正常;市电电压正常;逆变器正供电;
负载功率⼤于指定的电池曲线设定的电池⾃检功率;UPS不处于联合供电状态。
以上条件都满⾜时⽅可进⾏电池⾃检。如果在⾃检过程中,出现上述允许条件任意⼀条不满⾜,系统将退出⾃检,转⼊均充状态。
按停⽌⼿动⾃检,可以中⽌⾃检过程,电池转均充。电池⾃检结束转均充。(⼆)机房空调系统: (全包备件)
(1)全包备件保修⽅式(保修期内设备的维护保养、故障维修所需的备件均免费维修更换。包含免费更换过滤⽹、⽪带、风机、压缩机、电路板、室外电机、室外调速器、氟利昂等)。过滤⽹视情况进⾏更换,但每年提供不少于更换四次。⽪带每年进⾏⼀次更换。
(2)每3个⽉进⾏⼀次保养维护检查,巡检内容如下:1)、制冷系统:
检查压缩机⼯作声⾳是否正常;油镜油位是否正常;检查压缩机吸⽓排⽓压⼒是否正常:
制冷管路阀门(液管、⽓管、压缩机吸⼊及排出⼝阀门)是否打开;热⼒膨胀阀开启是否正常;压缩机转向;供电相序是否反相;
检查吸⽓管路、排⽓管路、回液管路和压缩机机体温度是否正常;⼲燥过滤器前后端有⽆温差;管路(含储液罐)有否漏油痕迹;视液镜⽔分指⽰是否正常;蒸发器盘管是否脏污;冷凝器翅⽚是否脏污;检查冷凝器风机⼯作是否正常;
检查冷凝器压⼒开关/风机调速设置是否正确;2)、送风系统:
检查风机⽪带轮和电机⽪带轮的平⾯度;检查室内风机⽪带张紧度;
检查室内风机轴承⼯作是否正常;声⾳有⽆异常;检查室内风机叶轮转动是否正常;
检查室内风压开关、过滤⽹压差开关设定值是否正确;清洁风机;
检查空⽓过滤⽹是否脏污;检查所有门板是否可靠;3)、电⽓系统
每半年紧所有接线端⼦;
检查各交流接触器吸合、分断是否正常;检查所有过流保护是否正常;整定值是否正常;检查主电源线电压、相电压、各相电流;
⼿动启动制冷/除湿、加热、加湿功能,检查电流是否正常;4)、控制系统:检查控制器初始设置是否正常;检查温湿度探头是否偏差;检查显⽰器⼯作是否正常;
检查所有数据及模拟输⼊、输出是否正常;5)、加湿系统
检查加湿器进⽔电磁阀和排⽔电磁阀动作;检查加湿器的蒸⽓排出管是否畅通;检查蒸汽凝结⽔排⽔是否正常;检查加湿罐结垢情况,清洗或更换;检查加湿器的进⽔过滤器;检查加湿器的溢⽔、排⽔盘;检查加湿器排⽔是否泄漏;检查冷凝排⽔是否泄漏;6)、管路系统
检查制冷管道保温和包扎是否完好;检查所有管路定位是否完好;
检查室内外机连接电缆⽼化情况是否满⾜空调运⾏需要;检查空调送风和回风管路/通道是否通畅;7)、给⽔、排⽔系统
检查给⽔系统是否正常;加湿进⽔电磁阀的进⽔过滤⽹是否脏堵;检查排⽔是否通畅。
最后出具维护报告,记录各项技术数据,并提出意见和建议,提供运⾏数据分析报告。报告需要客户签字认可。(三)服务器运维(全包备件)
我公司提供主动服务模式,做好服务规划,提前发现和解决问题,确保系统24*7运⾏,具体服务内容包括:系统故障定位和排错
Windows、Linux操作系统安装、升级操作系统补丁的更新服务器微码升级系统备份和系统恢复数据备份和数据恢复CPU、内存升级扩容替换故障硬盘、RAID重建更换电源、风扇等易损件更换主板和其他故障板卡
更换⼩型机和磁盘阵列中的各类到期电池系统参数的调整优化系统⽇志的检查和清除系统盘的镜像检查双机软件的状态检测系统⽬录空间状态使⽤的监测系统运⾏状态的监测安装新版本Linux系统
在新版本Linux系统上调试系统配置对已安装的新版本Linux系统进⾏测
维保设备(软件)范围内其它软件的升级服务
提供服务器年度维护服务,提供⼀年24次定期上门设备巡检,提前发现故障隐患,减少故障造成的宕机时间。在服务期间,机器硬件的损坏由我公司提供免费更换,客户不再⽀付任何其它费⽤。我公司提供主动服务模式,做好服务规划,提前发现和解决问题,确保系统24*7运⾏,具体服务内容包括:协助客户进⾏受⽀持的软件产品的基本的⽇常维护和管理。协助客户对所报告的问题进⾏定义及指导客户相关技术⼈员完成解决问题所需要的相关信息的收集⼯作。
我公司将帮助客户对所报告的问题进⾏问题根源的分析和诊断。对于软件本⾝的问题,我公司将根据需要向客户免费提供相关的修正性软件。
对客户所报告的有关受⽀持软件产品的问题,我公司将根据需要使⽤标准系统进⾏记录和跟踪,并根据实际情形对问题的严重程度和优先
级别进⾏设定和更新。
我公司将在应⽤软件安装完毕后应进⾏基本系统测试(四)存储系统运维(全包备件)
针对上述的中⼼数据机房存储系统相关设备维保服务,我公司提供主动服务模式,做好服务规划,提前发现和解决问题,确保系统24*7运⾏,具体服务内容包括:设备故障定位和排错设备软件版本升级配置状态检测
更换电源、风扇等易损构件系统使⽤状态检测系统⽇志分析和监控
为信息中⼼的存储设备产品提供⽇常维修、维护服务。
应急保障⽅案。综合分析xxx客户数据中⼼服务器的软硬件配置,应⽤情况,在第⼀次巡检后向局⽅提供安全、可靠、切实可⾏的应急⽅案。
为xxx客户的存储管理软件配置、备份策略审核等提供技术⽀持服务。
帮助xxx客户对存储系统进⾏性能分析:磁盘读写性能、数据存储备份安全性、I/O性能、解决数据存储性能故障、提⾼存储系统性能、
提升xxx客户IT系统整体性能。
根据xxx客户信息系统发展需求,规划新的存储备份系统、容灾系统等,解决⽤户IT数据安全、⾼速增长需要。为xxx客户提供存储信息⽣命周期整体规划,保障⽤户数据的⽣命⼒。
主机存储系统基本服务内容:序号服务模块内容描述提供⽅
1现场备件安装配合⽤户进⾏。按备件到达现场时间⼯程师到达现场⾦隆伟业
2补丁服务消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进⾏合理的平衡。设备⼚商
3升级服务对系统进⾏软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。设备⼚商
4现场故障诊断按服务级别:7×24⼩时⾦隆伟业
5电话远程技术⽀持7×24⼩时⾦隆伟业
6问题管理系统对遇到的问题进⾏汇总和发布设备⼚商
(五)虚拟化平台运维主要的内容如下:
服务报告提交服务结束次⽇定期巡检与预防性维护系统定期巡检维护2次/⽉健康性检查2次/⽉
专家巡检1次/⽉
系统及应⽤备份免费提供Fusion Sphere备份软件及安装部署系统软件恢复
系统检查及服务报告远程诊断
系统分析根据客户要求确定是否开启远程服务
远程故障解决根据客户要求确定是否开启远程服务
远程系统性能监控根据客户要求确定是否开启远程服务
(六)数据库系统运维1、Oracle数据库维保服务
健康巡检:提供每季度⼀次的健康巡检,包括:系统和数据库的可⽤性、完整性的检查;系统、数据库和应⽤性能的检查;系统的结构、恢复步骤、安装、安全扫描等相关问题的检查;对系统错误⽇志检查与分析,根据操作系统及Oracle的报错信息,发现系统潜在问题,尽早采取措施,排除故障隐患和安全漏洞。要求巡检后提交完整的检查报告和相关的改进建议报告。
备份恢复:根据采购⼈数据库系统实际情况,规划实施符合采购⼈⼯作要求的完善的备份恢复⽅案,以确保采购⼈数据库系统的安全可靠运⾏。在进⾏数据库备份恢复的规划实施过程中,服务⽅技术⼈员应对采购⼈的技术⼈员进⾏现场培训,确保采购⼈的技术⼈员可以独⽴完成相关备份⼯作;在数据库出现故障时,服务⽅应尽快安排技术⼈员到采购⼈现场,恢复客户系统,减少采购⼈停机时间。
故障处理:在数据库出现故障,导致数据库不能正常⼯作时,服务⽅安排技术⼈员2⼩时内到现场解决问题并保证问题完全解决。如果不能解决问题,服务⽅需⾃⾏请专家或其他⾼级技术⼈员对采购⼈系统情况进⾏分析,直⾄解决问题。
远程技术⽀持:服务⽅在接到采购⼈通知后的30分钟内响应,确认相关情况,进⾏电话、拨号等技术⽀持,如需现场协调现场进⾏处理。
性能调优:根据客户的需求和操作系统数据库系统的实际情况,定期分析⽤户的应⽤类型和⽤户⾏为、评价客户数据库的参数设置、数据分布、硬件和系统资源的使⽤情况等,并提出相关调整建议,必要时可以随时在规定的时间内派技术专家到达客户现场,处理客户系统性能问题,确保客户系统的⾼效运转。
紧急故障处理:因硬件、软件或⼈为操作等各种不同原因,引起的采购⼈数据库系统完全不能正常⼯作、严重影响业务系统正常运作
的故障时。能提够全年7×24⼩时(365*7*24)技术⽀持,在接到采购⼈请求后,0.5⼩时内安排技术⼈员给采购⼈技术⼈员回电,并在1⼩时内向⽤户提供处理⽅法。如果远程不能处理的紧急故障,服务⽅技术⼈员应在3⼩时内赶赴客户现场,搜集各种故障信息,诊断故障发⽣的原因,在4⼩时之内排除故障。
需求响应:当客户有主机及数据库部署、调整、优化等需求时,及时响应客户需求,给出客户最佳解决⽅案,经客户认可同意后,实施⽅案
2、Oracle透明⽹关服务
异构模式下实现Oracle数据库与SQL Server数据库联通,在SQL Server数据库下可以正常查询Oracle数据库数据(七)全院⽹络交换设备运维(全包备件)⽹络巡检服务
在维护服务期间,与主机和存储紧密配合,每个⽉⼀次现场巡检服务。⽹络环境与设备物理状况巡检1)环境检查巡检
UPS电源、地线、空调、散热、物理安全性2)物理状况巡检
包括:设备机体、外观、及风扇、风道及过滤器、状态指⽰灯、电源、VIP模块、⼴域⽹端⼝、局域⽹端⼝等。硬件部分巡检检查设备连接状况检查;
设备物理安全(电源冗余、机房环境、线缆);设备本⾝冗余性检查,包括引擎的冗余、电源的冗余;设备系统及板卡指⽰灯状态检查分析;
端⼝描述,端⼝安全性,不使⽤的端⼝建议关闭,端⼝性能检查;电源稳定性和线路检查;
设备有关的软件、硬件和BUG信息收集;
系统运⾏状态、性能检查和优化,包括CPU利⽤率、Mem使⽤率、Buffer分配、Crash分析;设备扩容服务检查分析与⽀持;
设备物理检查(包括机体、风扇、风道及过滤器等)与清洁;
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务