VERITAS Volume Manager 4.1
故障排除指南
Solaris x 平台版本Maintenance Pack 1
免责声明
本出版物包含的信息若有变动,恕不另行通知。VERITAS Software Corporation 对本手册不提供任何形式的保证,包括但不限于适销性和对于特定用途的适用性的暗示保证。VERITAS Software
Corporation 不对本手册中所含错误负责,也不对因提供、执行或使用本手册而伴随或相应产生的损失负责。
VERITAS 法律声明
版权所有 © 2006 VERITAS Software Corporation。保留所有权利。VERITAS 以及 VERITAS 徽标均为 VERITAS Software Corporation 或其附属机构在美国以及其他国家/地区的商标或注册商标。其他名称可能是各自所有者的商标。
VERITAS Software Corporation350 Ellis Street
Mountain View, CA 94043USA
Phone 650–527–8000 Fax 650–527–2908www.veritas.com第三方法律声明
数据加密标准 (DES) 版权
版权所有 © 1990 Dennis Ferguson。保留所有权利。
仅当可以在加拿大购买和/或使用从本软件派生或包含本软件的产品时,才能将本软件用于商业目的。否则,只允许以源代码和二进制形式再分发和使用本软件。
1985、1986、1987、1988、1990 年版权归麻省理工学院 (Massachusetts Institute of Technology, M.I.T.) 所有。保留所有权利。从美国出口本软件可能需要获得美国颁发的特别许可证。任何打算出口本软件的个人或单位都有责任在出口之前获得这种许可证。
在上述范围内,特此授予您可以出于任何目的免费使用、复制、修改和分发本软件及其文档的许可权限,前提是:上述版权声明必须出现在所有副本中;版权声明和本许可声明必须同时出现在支持文档中;未经事先明确的书面许可,不得在与软件分发有关的广告或宣传材料中使用 M.I.T. 的名称。M.I.T. 对本软件对于任何目的的适用性不作任何表示。本软件按原样提供,没有任何明示或暗示的保证。
Sun Microsystems 商标
Sun、Solaris、SunOS、Java、Sun Java System Cluster、Sun StorEdge、Solstice DiskSuite、Sun Fire、Sun Enterprise、Online:Backup 和 Netra 均为 Sun Microsystems, Inc. 在美国以及其他国家/地区的商标或注册商标。
所有 SPARC 商标均系 SPARC International 的商标或注册商标,经过许可才能使用。SPARC 商标基于 Sun Microsystems, Inc. 开发的一种体系结构。
iiVERITAS Volume Manager 故障排除指南目录
前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .v本指南的组织方式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .v约定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi获取帮助 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .vii文档反馈 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .viii第1章 从硬件故障中修复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1列出不可启动的卷 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2显示卷和 plex 状态 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2了解 plex 状态循环 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3修复不可启动的镜像卷 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5修复不可启动的卷(其中禁用的 plex 为 RECOVER 状态) . . . . . . . . . . . . . . . . . . . . . . .5强制重新启动禁用的卷 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6清除磁盘的出错标志 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6重新挂接出错的磁盘 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7RAID-5 卷上的故障 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8系统故障 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8磁盘故障 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9RAID-5 的默认启动修复过程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10修复 RAID-5 卷 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11在移动 RAID-5 子磁盘后修复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13启动 RAID-5 卷 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13从未完成的磁盘组移动中修复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16从 DCO 卷故障中修复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
iii
修复 0 版 DCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18修复 20 版 DCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20第2章 从即时快照操作故障中修复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21vxsnap prepare 失败 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21对完整空间即时快照执行 vxsnap make 失败 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22对断开即时快照执行 vxsnap make 失败 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22对优化空间即时快照执行 vxsnap make 失败 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22vxsnap restore 失败 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23vxsnap reattach 或 refresh 失败 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23写入时复制失败 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23重同步过程中的 I/O 错误 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24DCO 卷上的 I/O 故障 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24第3章 记录命令和事务 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25记录命令 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25记录事务 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27关联命令日志和事务日志 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28第4章 备份和恢复磁盘组配置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31备份磁盘组配置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32恢复磁盘组配置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33解决磁盘组的冲突备份 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34第5章 错误信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35记录错误信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35在启动脚本中配置日志记录 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36了解错误信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37错误信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38索引 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
ivVERITAS Volume Manager 故障排除指南前言
《VERITAS Volume Manager 故障排除指南》介绍从硬件故障中修复的方法,并说明如何理解和处理正常操作过程中出现的 VxVM (VERITAS Volume Manager) 错误信息。本指南包括从磁盘故障和其他硬件故障修复的准则,在这种磁盘或硬件上,用户使用 VERITAS Volume Manager 构建了子磁盘、plex 和卷虚拟软件对象。本指南还包括有关如何配置命令和事务日志,以及如何备份和恢复磁盘组配置的信息。本指南假定用户:
◆◆◆
具有基本的 SolarisTM 操作系统 (OS) 知识。基本了解 Solaris 系统管理。
基本了解如何使用 VERITAS Volume Manager 进行存储管理。
注意大多数 VERITAS Volume Manager 命令都要求具有超级用户权限或其他适当的
权限。
本指南的组织方式
本指南包括以下几部分:
◆◆◆◆◆
从硬件故障中修复
从即时快照操作故障中修复记录命令和事务备份和恢复磁盘组配置错误信息
有关此产品附带的其他文档的信息,请参考《发行说明》。
v
约定
约定
约定等宽字体
用法
用于路径名、命令、输出、目录名、文件名、函数以及参数。表示用户输入。
示例
从 /etc/vx/tunefstab 文件中读取可调值。
有关更多信息,请参见 ls(1) 手册页。# ls pubsC:\\> dir pubs
标识书名、新术语、强调文字以及用名称或值替换的变量。
有关详细信息,请参见《用户指南》。变量 system_name 表示您在其上输入命令的系统。
在密码字段中输入密码。按 Return 键。
请参见第vii页的“获取帮助”。# cp /pubs/4.0/user_book /release_mgnt/4.0/archiveC:\\> copy \\pubs\\4.0\bookc:\\release_mgnt\\4.0\\archive
等宽字体(加粗)
斜体粗体
表示 GUI 对象,例如字段、列表框、菜单选择等。还表示 GUI 命令。表示超文本链接。
Unix 超级用户提示符(所有 shell)。Windows 用户提示符。
蓝色文字#C:\\>
viVERITAS Volume Manager 故障排除指南获取帮助
获取帮助
如果您对 VERITAS 的产品有任何意见或疑问,请与 VERITAS 技术支持部门联系:
◆
中国客户:
电话:+86 (10) 85181088 或 800-810-9771传真:+86 (10) 85186718
电子邮件:support.china@veritas.com
http://www.veritas.com/zh/CN/index.jhtml
◆◆◆
美国和加拿大客户: 1-800-342-0652国际客户: +1 (650) 527-8555电子邮件:support@veritas.com
有关许可证信息,请与当地的 VERITAS 办事处联系:
◆
VERITAS SOFTWARE 北京办事处
中国北京市东城区东长安街一号 东方广场东方经贸城东三办公楼 1008 室邮编:100738
电话:+86 (10) 85180008传真:+86 (10) 85186718
◆VERITAS SOFTWARE 上海办事处
上海市南京西路1168号中信泰富广场3701室 邮编:200040
电话:+86 (21) 52925290传真:+86 (21) 52925291
◆VERITAS SOFTWARE 广州办事处广州市天河北路233号中信广场6501室 邮编:510613
电话:+86 (20) 38771799传真:+86 (20) 38771877
前言vii
文档反馈
◆
VERITAS SOFTWARE 成都办事处
成都市人民南路二段55号岷山饭店商务楼2311、2313室邮编:610016
电话:+86 (28) 85570001传真:+86 (28) 85531822
有关软件更新:
◆
电子邮件:swupdate@veritas.com
有关购买 VERITAS 产品的信息:
◆◆
电话:1-800-258-UNIX (1-800-258-) 或 1-650-527-8000电子邮件:sales.mail@veritas.com
要获取技术援助,请访问 http://support.veritas.com,并选择电话支持或电子邮件支持。利用此网站还可以访问技术说明 (TechNote)、产品资讯速递、软件下载、硬件兼容性列表和 VERITAS 客户电子邮件通知服务等资源。使用知识库搜索功能可以访问其他产品信息,包括最新发布以及过去发布的产品文档。
另外,还可以使用诊断工具来帮助解决与产品相关的问题。可从光盘上获得这些工具,也可从 VERITAS FTP 站点下载。有关详细信息,请参见 /support 目录下的 README.VRTSspt 文件。
有关许可证信息、软件更新和产品销售联系方法,请访问
https://my.veritas.com/productcenter/ContactVeritas.jsp。有关购买产品文档的信息,请访问 http://webstore.veritas.com。
文档反馈
您对于产品文档的反馈对我们非常重要。请将改进建议和有关错误或疏漏的报告发送至 foundation_docs@veritas.com,并注明文档的标题和部件号(位于标题页左下角),以及您报告中涉及的文字所属的章节标题。我们的目标是为客户提供有效的、高质量的文档,确保让客户满意。有关除文档以外的其他问题的帮助,请访问 http://support.veritas.com。
viiiVERITAS Volume Manager 故障排除指南从硬件故障中修复
1
VERITAS Volume Manager (VxVM) 可以保护系统免受磁盘和其他硬件故障的影响,并帮助您从这类事件中修复系统。本章描述的修复步骤和信息可帮助您防止因磁盘和其他硬件故障而导致数据丢失或无法访问系统。
如果一个卷发生磁盘 I/O 故障(例如,由于磁盘有无法纠正的错误),VxVM 可分离此故障所涉及的 plex。I/O 在该 plex 上停止,但在卷的其他 plex 上继续。
如果磁盘彻底损坏,VxVM 可将该磁盘从所在的磁盘组中分离出来。该磁盘上的所有 plex 都被禁用。如果分离时磁盘上有任何未镜像的卷,这些卷也被禁用。 注意某些看似磁盘故障的故障可能不是由于物理磁盘介质或磁盘控制器出错引起的,而
可能是因中间或附属部件(如电缆、主机总线适配器或电源)的错误所致。VxVM 中的热重定位功能自动检测磁盘故障,并通过电子邮件将故障通知给系统管理员和其他指定用户。热重定位还尝试使用备用磁盘和空闲磁盘空间来恢复冗余度,并保持对镜像卷和 RAID-5 卷的访问能力。有关更多信息,请参见《VERITAS Volume Manager 管理员指南》中的“管理热重定位”一章。
1
列出不可启动的卷
列出不可启动的卷
不可启动的卷可能未正确配置或存在其他妨碍其启动的错误或情况。要显示不可启动的卷,请使用 vxinfo 命令。以下命令显示卷的可访问性和可用性信息:
# vxinfo [-g diskgroup] [volume ...]
以下示例输出表明卷 mkting 不可启动:
home fsgen Started
mkting fsgen Unstartablesrc fsgen Startedrootvol root Startedswapvol swap Started
显示卷和 plex 状态
要显示有关卷配置(包括卷的状态和卷的 plex 的状态)的详细信息,请使用以下形式的 vxprint 命令:
# vxprint [-g diskgroup] -hvt [volume ...]
以下示例显示了一个禁用的卷 vol,它有两个干净的 plex vol-01 和 vol-02,每个 plex 都有一个子磁盘:
# vxprint -g mydg -hvt vol磁盘组:mydgVPLSDSVSCDCSPvplsdplsd
名称名称名称名称名称名称名称
RVG/VSET/CO卷PLEXPLEXPLEX父卷快照卷
内核状态内核状态磁盘卷名缓存日志卷DCODISABLEDDISABLEDmydg11DISABLEDmydg12
状态状态
磁盘偏移NVOLLAYR磁盘偏移
长度长度长度长度长度
读取策略布局
[COL/]关[COL/]关[COL/]关
首选PLEXUTYPENCOL/WID模式设备模式AM/NM模式设备模式
vol-vol-01 vol
mydg11-01vol-01vol-02 volmydg12-01vol-02ACTIVECLEAN0
CLEAN0212880212880212880212880212880SELECTCONCAT0
CONCAT0--c1t0d0-c1t1d0fsgenRWENARWENA
有关可能的 plex 状态和卷状态的说明,请参见《VERITAS Volume Manager 管理员指南》中的“创建和管理 plex”和“管理卷”这两章。
2VERITAS Volume Manager 故障排除指南了解 plex 状态循环
了解 plex 状态循环
更改 plex 状态是正常操作的一部分,并不一定表示出现了必须纠正的异常情况。清楚地了解各种 plex 状态及其相互之间的关系对于正确执行本章所述的修复步骤是十分必要的。图“主要的 plex 状态循环”, 显示了 VxVM 中 plex 状态之间发生的主要转换(有关 plex 状态的更多信息,请参见《VERITAS Volume Manager 管理员指南》中的“创建和管理 plex”一章)。
主要的 plex 状态循环
启动
(vxvol start)
PS:CLEANPKS:DISABLED
PS:ACTIVEPKS:ENABLED
关机(vxvol stop)
PS = Plex 状态 (Plex State)PKS = Plex 内核状态 (Plex Kernel State)
系统启动时,卷自动启动并且 vxvol start 任务使所有 CLEAN plex 变为 ACTIVE 状态。关机时,vxvol stop 任务将所有 ACTIVE plex 标记为 CLEAN。如果启动时所有 plex 为 CLEAN 状态,则表明曾发生了受控关机,系统将优化启动卷所需的时间。 下图第4页的“附加的 plex 状态转换”显示了因硬件问题、非正常关机和系统管理员干预而可能导致的 plex 状态之间的附加转换。
Plex 刚创建时的状态为 EMPTY,且一直保持到挂接该 plex 的卷被初始化为止。然后其状态被设置为 CLEAN。其 plex 内核状态保持为 DISABLED,直到卷启动后才设置为 ENABLED。
第 1 章 从硬件故障中修复
3
了解 plex 状态循环
附加的 plex 状态转换
创建 plex
PS:EMPTYPKS:DISABLED
PS:ACTIVEPKS:DISABLED
崩溃后重新启动 (vxvol start)
初始化 plex(vxvol init clean)
启动(vxvol start)
修复数据 (vxvol resync)
使 plex 脱机 (vxmend off)PS:OFFLINEPKS:DISABLED
数据重同步 (vxplex att)
使 plex 联机 (vxmend on)
PS:IOFAILPKS:DETACHED
重同步失败
PS:STALEPKS:DETACHED
PS:CLEANPKS:DISABLEDPS:ACTIVEPKS:ENABLED
关机 (vxvol stop)
无法纠正的 I/O 故障
PS = Plex 状态 (Plex State)PKS = Plex 内核状态 (Plex Kernel State)
在系统崩溃并重新启动后,卷的所有 plex 均为 ACTIVE 状态,但 plex 内核状态仍为 DISABLED,并且一直保持到 plex 数据被 vxvol resync 任务修复为止。
可以使用 vxmend off 命令使 plex 脱机,使用 vxmend on 命令使其重新联机,并在使用 vxplex att 重新挂接 plex 时使其数据与其他 plex 重新同步。失败的重同步或无法纠正的 I/O 故障会将 plex 置为 IOFAIL 状态。
在第5页的“修复不可启动的镜像卷”和随后部分中,描述了在系统崩溃或 I/O 错误导致镜像卷的所有 plex 均退出 CLEAN 和 ACTIVE 状态时可以采取的措施。
有关修复 RAID-5 卷的信息,请参见第8页的“RAID-5 卷上的故障”和随后的章节。
4VERITAS Volume Manager 故障排除指南修复不可启动的镜像卷
修复不可启动的镜像卷
系统崩溃或 I/O 错误会损坏镜像卷的一个或多个 plex,并使所有 plex 退出 CLEAN 和 ACTIVE 状态。可以将其中一个 plex 标记为 CLEAN,并指示系统使用该 plex 作为修复其他 plex 的来源。步骤如下:
1.使用以下命令将所需的 plex 置为 CLEAN 状态:
# vxmend [-g diskgroup] fix clean plex例如,将 plex vol01-02 置为 CLEAN 状态:# vxmend -g mydg fix clean vol01-02
2.要从 CLEAN plex 修复卷中的其他 plex,必须禁用该卷,并且其他 plex 必须处于
STALE 状态。可根据需要对所有其他 CLEAN 或 ACTIVE plex 依次运行以下命令,使其状态变为 STALE:
# vxmend [-g diskgroup] fix stale plex
3.要启用 CLEAN plex 并从中修复 STALE plex,请使用以下命令:
# vxvol [-g diskgroup] start volume例如,要修复卷 vol01,请使用以下命令:# vxvol -g mydg start vol01
有关 vxmend 和 vxvol 命令的更多信息,请参见 vxmend(1M) 和 vxvol(1M) 手册页。注意承载卷的所有镜像 plex 的几个磁盘或其他相关子系统发生严重的硬件故障后,用户
可能无法使用 vxmend 修复卷。在这种情况下,可以先删除该卷,在正常工作的硬件上重新创建它,然后从备份或快照映像中恢复该卷的内容。
修复不可启动的卷(其中禁用的 plex 为 RECOVER 状态)
如果某个 plex 的内容相对于卷来说已过时,则该 plex 会显示为 RECOVER 状态。当包含 plex 的一个或多个子磁盘的磁盘被替换或重新挂接时,会发生这种情况。如果某个 plex 显示为这种状态,可通过如下方式修复:
1.使用以下命令将 plex 强制设为 OFFLINE 状态:
# vxmend [-g diskgroup] -o force off plex第 1 章 从硬件故障中修复
5
强制重新启动禁用的卷
2.使用以下命令将 plex 置于 STALE 状态:
# vxmend [-g diskgroup] on plex3.如果卷中有其他 ACTIVE 或 CLEAN 状态的 plex,请使用以下命令将 plex 重新挂接到
卷中:
# vxplex [-g diskgroup] att plex volume如果卷已经启用,plex 的重同步将立即开始。
如果卷中没有其他干净的 plex,请使用以下命令将 plex 设为 DISABLED 和 CLEAN 状态:
# vxmend [-g diskgroup] fix clean plex4.如果尚未启用卷,请使用以下命令启动卷,并在后台执行所有的 plex 重同步:
# vxvol [-g diskgroup] -o bg start volume注意当 plex 中的数据已损坏,并且卷中没有可以从中重同步卷内容的 ACTIVE 或
CLEAN 冗余 plex 时,必须从备份或快照映像中恢复卷。
强制重新启动禁用的卷
如果由于磁盘故障导致某个卷被禁用,并且该卷中未包含任何有效的冗余 plex,则必须在更换出错的磁盘后从备份恢复该卷。对于所有被列为不可启动的卷,必须先使用 vxvol 命令重新启动这些卷,然后才能从备份中恢复其内容。
# vxvol [-g diskgroup] -o bg -f start volume
-f 选项将强制重新启动卷,而 -o bg 选项则作为后台任务重同步 plex。例如,要重新启动卷 myvol,以便能够从备份中恢复它,可使用以下命令:
# vxvol -g mydg -o bg -f start myvol
清除磁盘的出错标志
如果 I/O 错误是间歇性的而非持续性的,则 VERITAS Volume Manager 会在磁盘上设置出错标志,而不是分离磁盘。临时拔掉电缆、控制器出错、磁盘阵列中有部分出错的 LUN 或者磁盘中有少量损坏的扇区或磁道,都会引发此类错误。
如果硬件错误不是由磁盘本身造成的(例如,是由控制器出问题或磁盘电缆出问题造成的),则可以在从根本上纠正 I/O 错误之后,使用 vxedit 命令清除出错标志。
6VERITAS Volume Manager 故障排除指南重新挂接出错的磁盘
警告如果不知道引发 I/O 错误的原因,请不要清除出错标志。如果磁盘硬件确实出现了
问题,而您又清除了出错标志,则会有丢失数据的危险。清除磁盘上的出错标志:
1.使用 vxdisk list 命令找出出错的磁盘:
# vxdisk list设备类型c1t1d0s2auto:slicedc1t2d0s2auto:slicedc1t3d0s2auto:sliced. . .
磁盘mydg01mydg02mydg03
组mydgmydgmydg
状态online
online failingonline
2.使用 vxedit set 命令为每个被标记为出错的磁盘(在本例中为 mydg02)清除
标志:
# vxedit set failing=off mydg02
3.使用 vxdisk list 命令确认已清除出错标志:
# vxdisk list 设备类型c1t1d0s2auto:slicedc1t2d0s2auto:slicedc1t3d0s2auto:sliced. . .
磁盘mydg01mydg02mydg03
组mydgmydgmydg
状态onlineonlineonline
重新挂接出错的磁盘
如果系统在启动时找不到某个磁盘,或者在 VxVM 启动时某些磁盘驱动程序被卸载或无法装载(从而导致磁盘出错),则可以执行重新挂接操作。解决根本问题(如电缆或控制器错误)之后,使用 vxreattach 命令重新挂接磁盘,重新挂接之后 plex 不会被标记为“STALE”。但是,重新挂接操作必须在启动磁盘上的卷之前进行。可以在引导期间作为磁盘修复过程的一部分从 vxdiskadm 菜单中调用 vxreattach 命令。如果可能,vxreattach 将出错的磁盘介质记录重新挂接到具有同一设备名的磁盘上。重新挂接操作会将磁盘放在它以前所属的同一磁盘组中,并保留其原有磁盘介质名。
第 1 章 从硬件故障中修复
7
RAID-5 卷上的故障
重新挂接出错的磁盘:
1.如下例所示,使用 vxdisk list 命令查看出错的磁盘:
# vxdisk list 设备类型c1t1d0s2auto:slicedc1t2d0s2auto:sliced----磁盘mydg01mydg02mydg03mydg04
组mydgmydgmydgmydg
状态onlineonline
failed was:c1t3d0s2failed was:c1t4d0s2
2.一旦纠正错误,便可使用如下命令重新扫描设备列表,进而重新挂接磁盘:
# vxdctl enable
3.使用不带任何选项的 vxreattach 命令重新挂接磁盘:
# vxreattach
执行重新挂接操作之后,除非磁盘出错且必须替换,否则不必进行修复。如果最初的磁盘故障起因(或其他原因)仍然存在,则重新挂接操作可能失败。
可以不执行重新挂接操作,而是先使用 vxreattach-c 命令来检查该操作是否可行。该命令显示可以重新挂接磁盘的磁盘组和磁盘介质名称。 有关 vxreattach 命令的更多信息,请参见 vxreattach(1M) 手册页。
RAID-5 卷上的故障
故障有两种:系统故障 和磁盘故障。系统故障是指因操作系统崩溃或电源故障而使系统突然停止运行。磁盘故障是指因系统故障(如磁头划盘、磁盘上的电子元件故障或磁盘控制器故障)而使一些磁盘上的数据不可用。
系统故障
RAID-5 卷的设计使其能够在磁盘发生故障时以最低的磁盘空间消耗来保持可用性。但是,在发生系统故障后,许多 RAID-5 形式的卷都会有数据丢失。导致数据丢失的原因是系统故障致使 RAID-5 卷中的数据和奇偶校验不再同步。而失去同步则是因故障发生时无法确定未完成的写操作的状态所致。 如果在访问 RAID-5 卷时失去同步,则将该卷描述为具有失效的奇偶校验。此时必须通过以下方法重新构建奇偶校验:读取每个条带中的所有非奇偶列,重新计算奇偶校验,然后写出条带中的奇偶校验条带单元。由于必须对卷中的每个条带执行此操作,因此这需要很长时间才能完成。
8VERITAS Volume Manager 故障排除指南RAID-5 卷上的故障
警告当对没有 日志 plex 的 RAID-5 卷进行重同步时,卷中磁盘的任何故障都会导致其数
据丢失。重同步过程除易出故障之外,还会占用系统资源并使系统运行速度变慢。
RAID-5 日志保留故障发生时所写入数据的副本,因而可减少因系统故障导致的损失。重同步过程包括从日志中读取数据及奇偶校验,然后将它们写入 RAID-5 卷的相应区域。这可以大大缩短数据和奇偶校验重同步所需的时间。它还意味着卷永远不会真正失效。任何时候卷中所有条带的数据和奇偶校验均为已知,因此,单个磁盘的故障不会导致卷中的数据丢失。
磁盘故障
当磁盘故障、电缆连接或其他问题导致磁盘上的数据不可用时,将出现无法纠正的 I/O 错误。对于 RAID-5 卷,则意味着有一个子磁盘不可用。该子磁盘不能用来存储数据,并且被视为失效 且已分离。即使基础磁盘变为可用或被更换,该子磁盘仍被视为失效并且不被使用。
当系统尝试读取失效子磁盘上的数据时,它将通过条带中所有其他条带单元上的数据重新构建这些数据。此操作称为重构读取。与单纯读取数据相比,这是一个开销很大的操作,会导致读取性能下降。当 RAID-5 卷包含失效的子磁盘时,它被视为处于退化模式。 处于退化模式的 RAID-5 卷可从 vxprint -ht 命令的输出中识别出来,如下所示: V名称RVG/VSET/CO内核状态PL名称卷内核状态SD名称PLEX磁盘SV名称PLEX卷名...
vr5vol-ENABLEDplr5vol-01r5volENABLEDsddisk01-01r5vol-01disk01sddisk02-01r5vol-01disk02sddisk03-01r5vol-01disk03plr5vol-02r5volENABLEDsddisk04-01r5vol-02disk04plr5vol-03r5volENABLEDsddisk05-01r5vol-03disk05
状态长度状态长度磁盘偏移长度NVOLLAYR长度DEGRADED204800ACTIVE204800010240001024000102400LOG144001440LOG144001440
读取策略
布局
[COL/]关[COL/]关RAIDRAID0/01/02/0CONCAT0
CONCAT0
首选PLEXNCOL/WID设备AM/NM-3/16c2t9d0c2t10d0c2t11d0-c2t12d0-c2t14d0
UTYPE模式模式模式raid5RWENAdSENARWENARWENA
如卷状态所示,卷 r5vol 处于退化模式,它被标为 DEGRADED。出错的子磁盘是 disk02-01,如 MODE 标志所示;d 表示子磁盘已分离,S 表示子磁盘的内容失效。注意不要对处于退化模式的 RAID-5 卷运行 vxr5check 命令。
第 1 章 从硬件故障中修复
9
RAID-5 卷上的故障
包含 RAID-5 日志 plex 的磁盘也可能会发生故障。如果 RAID-5 日志已镜像,则单个 RAID-5 日志 plex 出故障对卷的操作没有直接影响。但是,卷中所有 RAID-5 日志 plex 丢失会使卷容易彻底失败。在 vxprint -ht 命令的输出中,有故障的 RAID-5 日志 plex 是通过显示为 BADLOG(而不是 LOG)的 plex 状态来指示。以下输出说明了这种情况,其中 RAID-5 日志 plex r5vol-02 已失败:
V名称RVG/VSET/CO内核状态状态长度PL名称卷内核状态状态长度SD名称PLEX磁盘磁盘偏移长度SV名称PLEX卷名NVOLLAYR长度...
vr5vol-ENABLEDACTIVE204800plr5vol-01r5volENABLEDACTIVE204800sddisk01-01r5vol-01disk010102400sddisk02-01r5vol-01disk020102400sddisk03-01r5vol-01disk030102400plr5vol-02r5volDISABLEDBADLOG1440sddisk04-01r5vol-02disk0401440plr5vol-03r5volENABLEDLOG1440sddisk05-01r5vol-12disk0501440
读取策略
布局
[COL/]关[COL/]关RAIDRAID0/01/02/0CONCAT0
CONCAT0
首选PLEXNCOL/WID设备AM/NM-3/16c2t9d0c2t10d0c2t11d0-c2t12d0-c2t14d0
UTYPE模式模式模式raid5RWENAENAENARWENARWENA
RAID-5 的默认启动修复过程
VxVM 可能需要执行若干操作才能完全恢复 RAID-5 卷的内容并使它可用。无论何时启动卷,所有 RAID-5 日志 plex 均在卷启动之前被设置为零。这样可以防止随机数据被解释为日志项并破坏卷的内容。此外,还可能需要修复某些子磁盘,或可能需要重同步奇偶校验(如果 RAID-5 日志出错)。 启动 RAID-5 卷时,VxVM 执行下列步骤:
1.如果 RAID-5 卷未正常关闭,则检查它是否存在有效的 RAID-5 日志 plex。
◆
如果存在有效的日志 plex,则重新播放它们。重放过程是通过将卷内核状态置为
DETACHED、将卷状态设置为 REPLAY 并启用 RAID-5 日志 plex 来完成的。如果能够成功读取日志并且重放成功,请转到步骤 2。
如果没有有效的日志,则必须重同步奇偶校验。重同步是通过将卷内核状态置为 DETACHED 并将卷状态设置为 SYNC 来完成的。所有的日志 plex 都保持 DISABLED plex 内核状态。
由于重同步奇偶校验过程中任何子磁盘失败都会导致卷无法使用,因此重同步期间卷被设为不可用。通过将 -o unsafe start 选项和 vxvol 命令一起使用可改写此设置。如果存在任何失效的子磁盘,则 RAID-5 卷无法使用。
◆
警告-o unsafe start 选项被视为是有害选项,因为它会使卷的内容不可用。因此建议不要使用该选项。
10VERITAS Volume Manager 故障排除指南RAID-5 卷上的故障
2.将现有的所有日志 plex 置零并启用这些日志。如果此过程中所有日志都失败,则启动
进程中止。3.如果不存在失效子磁盘或现有的失效子磁盘可以修复,则卷被置为 ENABLED 卷内核状
态,卷状态被设置为 ACTIVE。至此,卷已启动。
修复 RAID-5 卷
RAID-5 卷通常需要的修复类型如下:
◆◆◆
奇偶校验重同步日志 Plex 的修复失效子磁盘的修复
通常在 RAID-5 卷启动时或系统引导之后不久执行奇偶校验重同步和失效子磁盘修复。也可通过运行 vxrecover 命令来执行它们。
有关启动 RAID-5 卷的更多信息,请参见第13页的“启动 RAID-5 卷”。
如果磁盘发生故障时热重定位功能是激活的,除非没有合适的磁盘空间用于重定位,否则不需要系统管理员干预。热重定位功能通过故障触发,并且系统管理员会收到有关故障的电子邮件通知。 热重定位操作自动尝试重定位出错的 RAID-5 plex 的子磁盘。发生重定位后,热重定位后台驻留程序 (vxrelocd) 还会启动奇偶校验重同步。 如果 RAID-5 日志 plex 失败,则仅当该日志 plex 已被镜像时才发生重定位;vxrelocd 后台驻留程序此时启动镜像重同步来重新创建 RAID-5 日志 plex。如果在故障发生时热重定位功能被禁用,则需要系统管理员来启动重同步或修复操作。 注意在 RAID-5 plex 的几个基础磁盘或其他相关子系统发生严重硬件故障后,用户可能
无法使用本章所述方法修复卷。在这种情况下,可删除该卷并在正常工作的硬件上重新创建它,然后从备份中恢复该卷的内容。
奇偶校验重同步
大多数情况下,RAID-5 阵列无失效的奇偶校验。仅当 RAID-5 卷的所有 RAID-5 日志 plex 都失败并且存在系统故障时,才出现失效的奇偶校验。即使 RAID-5 卷有失效的奇偶校验,通常也会在卷启动过程中修复它。 如果启动了没有有效的 RAID-5 日志的卷并且该进程在卷重同步之前停止,则会产生带失效的奇偶校验的活动卷。有关 vxprint -ht 命令的输出示例,请参见以下失效 RAID-5 卷的示例:
第 1 章 从硬件故障中修复
11
RAID-5 卷上的故障
V名称RVG/VSET/CO内核状态PL名称卷内核状态SD名称PLEX磁盘SV名称PLEX卷名...
vr5vol-ENABLEDplr5vol-01r5volENABLEDsddisk01-01r5vol-01disk01sddisk02-01r5vol-01disk02sddisk03-01r5vol-01disk03...
状态状态磁盘偏移NVOLLAYRNEEDSYNCACTIVE000
长度长度长度长度读取策略布局
[COL/]关[COL/]关首选PLEXNCOL/WID设备AM/NM-3/16c2t9d0c2t10d0c2t11d0
UTYPE模式模式模式raid5RWENAdSENA
204800RAID204800RAID1024000/01024001/01024002/0
此输出将卷状态显示为 NEEDSYNC,表明需要重同步奇偶校验。卷状态也可能是 SYNC,表明启动时尝试进行同步,并且同步进程应正在执行同步。如果不存在这样的进程,或者如果卷处于 NEEDSYNC 状态,则可以通过对 vxvol 命令使用 resync 关键字来手动启动同步操作。例如,要重同步第14页的“无效的 RAID-5 卷”中的 RAID-5 卷,请使用以下命令:
# vxvol -g mydg resync r5vol
通过向 RAID-5 卷发出 VOL_R5_RESYNC ioctls 可重新生成奇偶校验。重同步过程从 RAID-5 卷的起始处开始,对大小等于 -o iosize 选项指定的扇区数的区域进行重同步。如果未指定 -o iosize 选项,则使用默认的最大 I/O 大小。然后,resync 操作移到下一个区域进行,直到整个 RAID-5 卷长都被重同步为止。
对于较大的卷,奇偶校验重建需要很长时间,在操作完成前有可能发生系统关机或崩溃。如果系统关机,奇偶校验重建过程必须在系统重新启动后继续进行。否则,该过程必须从头开始。 为了避免从头再来,奇偶校验重建中将被设置检查点。这意味着奇偶校验重建过程所到达的偏移位置将被存储在配置数据库中。-o checkpt=size 选项控制保存检查点的频率。如果未指定该选项,则使用默认的检查点大小。 由于保存检查点偏移要求进行事务处理,因此检查点太小会延长奇偶校验重建所需的时间。在重新启动系统后,检查点偏移小于卷长的 RAID-5 卷会在检查点偏移处启动奇偶校验重同步。
日志 Plex 的修复
磁盘故障可能会使 RAID-5 日志 plex 分离。在 vxplex 命令中使用 att 关键字可以重新挂接这些 RAID-5 日志。要重新挂接失败的 RAID-5 日志 plex,请使用以下命令:
# vxplex -g mydg att r5vol r5vol-l1
12VERITAS Volume Manager 故障排除指南RAID-5 卷上的故障
失效子磁盘的修复
失效子磁盘的修复通常在卷启动时完成。但是,执行修复的进程可能会崩溃,或者卷可能是通过 -o delayrecover 这样的妨碍子磁盘修复的选项启动的。此外,还有可能未执行修复操作就替换了子磁盘所在的磁盘。在这些情况下,可以使用 vxvol recover 命令执行子磁盘修复。例如,要修复第14页的“无效的 RAID-5 卷”中显示的 RAID-5 卷中的失效子磁盘,请使用以下命令:
# vxvol -g mydg recover r5vol disk05-00
具有多个失效子磁盘的 RAID-5 卷只需一个操作即可修复。要修复多个失效子磁盘,请对卷使用 vxvol recover 命令,如下面的命令所示:
# vxvol -g mydg recover r5vol
在移动 RAID-5 子磁盘后修复
当移动或更换了 RAID-5 子磁盘时,新的子磁盘被标记为 STALE 以待修复。如果卷是活动的,则可以使用 vxsd 命令对卷进行修复。如果卷不活动,则当它下次启动时会进行修复。修复操作期间的 RAID-5 卷是退化的。 移动操作所涉及的条带中的任何故障都会使卷不可用。如果奇偶校验失效,则 RAID-5 卷也会变为无效。为避免这种现象,在下列情况下,vxsd 不允许移动子磁盘:
◆◆◆
失效子磁盘占用了正在移动的子磁盘所用的任何条带RAID-5 卷停止但未正常关闭;即,奇偶校验被视为失效RAID-5 卷活动并且没有有效的日志区域
只有第三种情况可通过使用 -o force 选项来改写。
RAID-5 卷的子磁盘还可以使用 vxsd split 命令和 vxsd join 命令分割或结合。这些操作的工作方式与在镜像卷上相同。
注意RAID-5 子磁盘移动和其他卷类型的子磁盘移动的执行方式相同,但没有冗余退化的
缺点。
启动 RAID-5 卷
在 RAID-5 卷启动时,它的状态可以是许多状态中的一种。在系统正常关闭后,卷应是干净的并且不需要修复。但是,如果卷没有关闭,或者在崩溃之前没有卸载,则在启动 RAID-5 卷并使它可用之前会要求进行修复。本节描述在特定条件下可以采取的措施。在正常条件下,在重新启动和自动进行或手动通过 vxrecover 命令进行任何修复之后,卷都自动启动。
第 1 章 从硬件故障中修复
13
RAID-5 卷上的故障
不可启动的 RAID-5 卷
如果 RAID-5 plex 的某些部分未映射 RAID-5 卷长度,则该卷不可用:
◆◆
RAID-5 plex 不能比 RAID-5 卷稀疏
RAID-5 plex 未映射一个条带中有两个子磁盘出错的区域,故障原因是子磁盘失效,或
者是子磁盘建立在出错的磁盘上。
发生这种情况时,vxvol start 命令返回以下错误信息:
VxVM vxvol 错误 V-5-1-1236 卷 r5vol 不可启动;RAID-5 plex 未映射整个卷长。
此时,RAID-5 卷的内容不可用。
RAID-5 卷无法启动的另一种可能的原因是,奇偶校验失效且子磁盘分离或失效。发生这种情况是由于包含出错的子磁盘的条带内的奇偶校验条带单元无效(因为奇偶校验失效)并且 出错的子磁盘上的条带单元也无效。图第14页的“无效的 RAID-5 卷”阐释了由于奇偶校验失效和子磁盘故障而导致 RAID-5 卷无效的情况。
无效的 RAID-5 卷
disk00-00disk01-00disk02-00WXY数据数据奇偶校验数据数据奇偶校验数据数据奇偶校验数据数据奇偶校验WXYZdisk03-00disk04-00disk05-00RAID-5 PlexZ本示例显示了 RAID-5 阵列中的四个条带。所有奇偶校验均失效且子磁盘 disk05-00 发生故障。这使条带 X 和 Y 因条带中发生两种故障而不可用。
这是一个条带内发生两种故障从而导致卷无法使用的情况。在这种情况下,vxvol start 命令的输出为:
VxVM vxvol 错误 V-5-1-1237 卷 r5vol 不可启动;某些子磁盘不可用且奇偶校验失效。
14VERITAS Volume Manager 故障排除指南RAID-5 卷上的故障
如果始终 在 RAID-5 卷中使用两个或更多的 RAID-5 日志 plex,则可避免这种情况。
RAID-5 日志 plex 可防止卷内的奇偶校验失效,因而避免了这种情况的发生(详见第8页的“系统故障”)。
强制启动 RAID-5 卷
即使子磁盘被标记为失效也可以启动卷:例如,停止的卷有失效的奇偶校验,没有 RAID-5 日志,并且某个磁盘分离然后重新挂接,就属于这种情况。 即使数据没有过期也认为子磁盘失效(原因是在子磁盘不可用时使用了卷),并认为
RAID-5 卷无效。为防止这种情况出现,应尽可能始终保持有多个有效的 RAID-5 日志与阵列相关联。
要启动具有失效的子磁盘的 RAID-5 卷,可以将 -f 选项与 vxvol start 命令一起使用。这使所有失效子磁盘都标记为未失效。标记操作发生在 start 操作评估 RAID-5 卷的有效性并确定启动所需的条件之前。另外,可通过使用以下命令将单个子磁盘标记为未失效:
# vxmend [-g diskgroup] fix unstale subdisk◆
如果某些子磁盘因失效而需要修复,并且存在有效的日志,则通过将卷置为 ENABLED 内核状态可启用该卷,并且在子磁盘修复期间该卷可用。否则,卷的内核状态将设置为 DETACHED,并且该卷在子磁盘修复期间不可用。 这样做是因为,如果卷活动时系统崩溃或卷异常停止,则奇偶校验会变为失效,从而使卷不可用。如果不希望这种做,则可使用 -o unsafe start 选项来启动卷。 警告-o unsafe start 选项被视为是有害选项,因为它会使卷的内容不可用。因此
建议不要使用此选项。
◆
卷状态被设置为 RECOVER 且失效子磁盘被修复。由于每个子磁盘上的数据变为有效,因此子磁盘不再标记为失效。 如果有任何子磁盘的修复失败且没有有效的日志,则因为子磁盘仍处于失效状态,卷的启动将中止,并且系统崩溃会使 RAID-5 卷不可用。这也可以通过使用 -o unsafe start 选项来改写。
如果卷有有效的日志,则子磁盘修复故障会被记录下来,但不会停止启动过程。
◆
当所有子磁盘均修复时,卷被置为 ENABLED 内核状态且标记为 ACTIVE。至此,卷已启动。
第 1 章 从硬件故障中修复
15
从未完成的磁盘组移动中修复
从未完成的磁盘组移动中修复
如果在磁盘组移动、分割或结合操作正在进行时系统崩溃或子系统失败,则在系统重新启动或子系统修复时,VxVM 会尝试反转或完成此操作。具体情况取决于操作的进度。自动修复取决于是否能导入源磁盘组和目标磁盘组。如果该条件不能满足(例如,如果其中一个磁盘组已导入另一主机),则执行以下步骤来修复磁盘组:1.使用 vxprint 命令检查这两个磁盘组的配置。未完成移动的磁盘组中的对象的
TUTIL0 字段设置为 MOVE。2.输入以下命令尝试完成移动:
# vxdg recover sourcedg如果因为其中一个磁盘组已导入到另一主机或因为它不存在而不能导入,则此操作失败:
VxVM vxdg 错误 V-5-1-2907 diskgroup:磁盘组不存在
如果修复失败,请根据需要执行下列步骤。
❖
如果磁盘组已导入到另一主机,将它从那个主机上逐出,然后导入当前主机。如果在源磁盘组或目标磁盘组中,所有需要的对象均已存在,则使用以下命令在该磁盘组中重新设置 MOVE 标志:
# vxdg -o clean recover diskgroup1在另一磁盘组上使用以下命令,将那些 TUTIL0 字段标记为 MOVE 的对象删除:# vxdg -o remove recover diskgroup2❖
如果只能导入一个磁盘组,则使用以下命令在此磁盘组上重新设置 MOVE 标志:# vxdg -o clean recover diskgroup从 DCO 卷故障中修复
注意本节中的过程取决于 DCO 版本号。有关 DCO 版本的信息,请参见《VERITAS
Volume Manager 管理员指南》。保留式快速重同步使用数据更改对象 (DCO) 卷来跟踪卷中的已更改区域。如果读取或写入 DCO 日志卷时发生错误,则分离该卷并在 DCO 上设置 badlog 标志。以后写入卷的所有内容将不被 DCO 跟踪。
16VERITAS Volume Manager 故障排除指南从 DCO 卷故障中修复
以下 vxprint 命令的输出示例显示了一个具有分离 DOC 卷的完整卷(为清楚起见,省略了 TUTIL0 和 PUTIL0 字段):
类型名称
dgmydgdm mydg01dm mydg02dm mydg03dm mydg04dm mydg05
关联mydg
c4t50d0s2c4t51d0s2c4t52d0s2c4t53d0s2c4td0s2
内核状态------长度-3552140835521408355214083552140835521408204800204800204800-144144144-204800204800204800204800204800-144144144144144-PLEX偏移--------0---0---0-0---0-0-状态 ...---FAILINGFAILING-ACTIVEACTIVE--ACTIVEACTIVE--ACTIVEACTIVE-ACTIVE-BADLOGDETACHACTIVE-IOFAILRELOCATE-
v SNAP-vol1fsgenENABLED
pl vol1-03SNAP-vol1ENABLED
sd mydg05-01vol1-03ENABLEDdcSNAP-vol1_dcoSNAP-vol1-v SNAP-vol1_dclgenENABLED
pl vol1_dcl-03SNAP-vol1_dclENABLED
sd mydg05-02vol1_dcl-03ENABLEDspvol1_snpSNAP-vol1-v vol1fsgen
pl vol1-01vol1sd mydg01-01vol1-01pl vol1-02vol1
sd mydg02-01 vol1-01dcvol1_dcovol1v vol1_dclgen
pl vol1_dcl-01vol1_dclsd mydg03-01vol1_dcl-01pl vol1_dcl-02vol1_dcl
sd mydg04-01vol1_dcl-02
spSNAP-vol1_snpvol1
ENABLEDENABLEDENABLEDENABLEDENABLED-DETACHEDENABLEDENABLEDDETACHEDENABLED-
此输出显示了镜像卷 vol1、它的快照卷 SNAP-vol1 和它们相应的 DCO vol1_dco 和 SNAP-vol1_dco。保存 vol1 的 DOC 卷 vol1_dcl 的 DCO plex 的两个磁盘 mydg03 和 mydg04 发生故障。因此,分离了卷 vol1 的 DCO 卷 vol1_dcl,并将 vol1_dco 的状态设置为 BADLOG。为了将来参考,请记下分别指向 vol1 和 SNAP-vol1 的 snap 对象 vol1_snp 和 SNAP-vol1_snp 的项。
可以使用该输出推导出卷的 DOC 名称(在此例中为 vol1_dco),或者使用以下 vxprint 命令显示卷的 DOC 名称:
# vxprint [-g diskgroup] -F%dco_name volume可以使用 vxprint 命令检查是否为卷的 DCO 设置了 badlog 标志,如下所示:
# vxprint [-g diskgroup] -F%badlog dco_name第 1 章 从硬件故障中修复
17
从 DCO 卷故障中修复
如果设置了 badlog 标志,则此命令返回值 on。对于上面的输出示例,此命令应采用以下形式:
# vxprint -g mydg -F%badlog vol1_dcoon
可以使用以下命令验证 DOC 的版本号:
# vxprint [-g diskgroup] -F%version dco_name返回值为 0 或 20。对于上面的输出示例,此命令应采用以下形式:
# vxprint -g mydg -F%version vol1_dco
DCO 版本号决定应该使用的修复过程:
◆◆
第18页的“修复 0 版 DCO”第20页的“修复 20 版 DCO”
修复 0 版 DCO
对于 0 版 DCO,请执行以下步骤来修复 DCO 卷:1.解决导致 I/O 故障的问题。
2.使用以下命令从 DCO 中删除 badlog 标志:
# vxdco [-g diskgroup] -o force enable dco_name对于上面的输出示例,此命令应采用以下形式:# vxdco -g mydg -o force enable vol1_dco
vxprint 输出中用于 vol1_dco 的项现在类似于:dc vol1_dco
vol1
----
3.使用以下命令重新启动 DCO 卷:
# vxvol [-g diskgroup] start dco_log_vol对于上面的输出示例,此命令应采用以下形式:# vxvol -g mydg start vol1_dcl
18VERITAS Volume Manager 故障排除指南从 DCO 卷故障中修复
4.使用 vxassist snapclear 命令清除原始卷及其所有快照的快速重同步映像。这样
可以确保在对快照进行快照合并(执行完全重同步)时不会使用有可能失效的快速重同步映像。任何后续的卷快照操作都重新启用快速重同步跟踪。
警告在将 badlog 标志从 DCO 中删除后,必须对该卷的所有快照使用 vxassist
snapclear 命令。否则,在对快照进行快照合并时有可能丢失或损坏数据。如果卷及其快照卷在同一磁盘组中,则以下命令将同时清除这两个卷的快速重同步映像:
# vxassist [-g diskgroup] snapclear volume snap_obj_to_snapshot其中,snap_obj_to_snapshot 是与指向快照卷的 volume 关联的 snap 对象的名称。对于上面的输出示例,此命令应采用以下形式:
# vxassist -g mydg snapclear vol1 SNAP-vol1_snp
如果快照卷和原始卷在不同的磁盘组中,则必须分别对每个卷执行 snapclear 操作:# vxassist -g diskgroup1 snapclear volume snap_obj_to_snapshot# vxassist -g diskgroup2 snapclear snapvol snap_obj_to_volume其中,snap_obj_to_volume 是与指向原始卷的快照卷 snapvol 关联的 snap 对象的名称。
对于上面的输出示例,如果已将 SNAP-vol1 移到磁盘组 snapdg 中,此命令应采用以下形式:
# vxassist -g mydg snapclear vol1 SNAP-vol1_snp# vxassist -g snapdg snapclear SNAP-vol1 vol1_snp
5.要对上一步中执行了 snapclear 操作的快照卷进行快照合并,请使用以下命令(如
有必要,可在使用 vxdg move 命令将快照 plex 移回原始磁盘组之后执行):
# vxplex -f [-g diskgroup] snapback volume snapvol_plex对于上面的输出示例,此命令应采用以下形式:# vxplex -f -g mydg snapback vol1 vol1-03
注意不能使用 vxassist snapback,因为 snapclear 操作会删除快照关联信息。
第 1 章 从硬件故障中修复
19
从 DCO 卷故障中修复
修复 20 版 DCO
对于 20 版 DCO,请执行以下步骤来修复 DCO 卷:1.解决导致 I/O 故障的问题。
2.使用 vxsnap 命令分离每个与卷关联的完整空间即时快照卷:
# vxsnap [-g diskgroup] dis snapvol对于上面的输出示例,此命令应采用以下形式:# vxsnap -g mydg dis SNAP-vol1
3.使用以下命令取消卷的准备:
# vxsnap [-g diskgroup] unprepare volume对于上面的输出示例,此命令应采用以下形式:# vxsnap -g mydg unprepare vol1
4.使用 vxvol 命令启动卷:
# vxvol [-g diskgroup] start volume对于上面的输出示例,此命令应采用以下形式:# vxvol -g mydg start vol1
5.使用以下命令再次准备卷:
# vxsnap [-g diskgroup] prepare volume [ndcomirs=number] \\
[regionsize=size] [drl=yes|no|sequential] \\[storage_attribute ...]
对于上面的输出示例,此命令可采用以下形式:
# vxsnap -g mydg prepare vol1 ndcomirs=2 drl=yes
这将为 DCO 卷添加 2 个 plex,还将启用 DRL 和快速重同步(如果得到授权)。有关如何使用 vxsnap prepare 命令的全部详细信息,请参见《VERITAS Volume Manager 管理员指南》和 vxsnap (1M) 手册页。
20VERITAS Volume Manager 故障排除指南从即时快照操作故障中修复
本章描述如何从即时快照操作过程中发生的各种故障和错误中修复:
◆◆◆◆◆◆◆◆◆
2
vxsnap prepare 失败
对完整空间即时快照执行 vxsnap make 失败对断开即时快照执行 vxsnap make 失败对优化空间即时快照执行 vxsnap make 失败vxsnap restore 失败
vxsnap reattach 或 refresh 失败写入时复制失败
重同步过程中的 I/O 错误DCO 卷上的 I/O 故障
有关创建和管理即时快照的全部详细信息,请参见《VERITAS Volume Manager 管理员指南》和 vxsnap (1M) 手册页。
vxsnap prepare 失败
如果 vxsnap prepare 操作过早失败,vxprint 命令可能以 INSTSNAPTMP 状态显示新的 DCO 卷。VxVM 通常可以在没有干预的情况下修复 DCO 卷。但在某些情况下,此修复可能不会成功。如果发生这种情况,请使用以下命令删除 DCO 卷:
# vxedit [-g diskgroup] rm DCO_volume或者选择系统下次重新启动时自动删除 DCO 卷。将 DCO 卷删除后,请再次运行 vxsnap prepare 命令。
21
对完整空间即时快照执行 vxsnap make 失败
对完整空间即时快照执行 vxsnap make 失败
在创建完整空间即时快照的过程中,如果 vxsnap make 操作失败,则快照卷可能变为 DISABLED 状态、被标记为无效且无法启动。可使用以下命令检查是否将 inst_invalid 标志设置为 on:
# vxprint [-g diskgroup] -F%inst_invalid snapshot_volumeVxVM 通常可以在没有干预的情况下修复快照卷。但在某些情况下,此修复可能不会成功。如果发生这种情况,请使用以下步骤删除 DCO 卷:1.使用 vxmend 命令清除快照卷的 tutil0 字段:
# vxmend [-g diskgroup] clear tutil0 snapshot_volume2.对快照卷运行以下命令:
# vxsnap [-g diskgroup] unprepare snapshot_volume3.为快照操作再次准备快照卷:
# vxsnap [-g diskgroup] prepare snapshot_volume对断开即时快照执行 vxsnap make 失败
在创建第三镜像断开即时快照的过程中,如果 vxsnap make 操作失败,则快照卷可能变为 INSTSNAPTMP 状态。VxVM 通常可以在没有干预的情况下修复快照卷。但在某些情况下,此修复可能不会成功。如果发生这种情况,请使用以下命令删除快照卷:
# vxedit [-g diskgroup] rm snapshot_volume或者选择系统下次重新启动时自动删除快照卷。
对优化空间即时快照执行 vxsnap make 失败
在创建优化空间即时快照的过程中,如果 vxsnap make 操作失败,则快照卷可能变为 INSTSNAPTMP 状态。VxVM 通常可以在没有干预的情况下修复快照卷。但在某些情况下,此修复可能不会成功。如果发生这种情况,请使用以下命令删除快照卷:
# vxedit [-g diskgroup] rm snapshot_volume或者选择系统下次重新启动时自动删除快照卷。
如果通过指定 cache 属性,对准备好的缓存对象执行 vxsnap make 操作,则删除快照后缓存对象保持不变。如果使用 cachesize 属性指定了新的缓存对象,删除快照后该缓存对象便不继续存在。
22VERITAS Volume Manager 故障排除指南vxsnap restore 失败
vxsnap restore 失败
如果 vxsnap restore 操作失败,所修复的卷可能变为 DISABLED 状态。使用以下命令启动卷:
# vxvol [-g diskgroup] start volumevxsnap reattach 或 refresh 失败
如果 vxsnap reattach 或 refresh 操作失败,所刷新的卷可能变为 DISABLED 状态、被标记为无效且无法启动。可使用以下命令检查是否将 inst_invalid 标志设置为 on:
# vxprint [-g diskgroup] -F%inst_invalid volume使用以下步骤修复卷:
1.使用 vxmend 命令清除卷的 tutil0 字段:
# vxmend [-g diskgroup] clear tutil0 volume2.使用 vxsnap 命令将卷从快照分层结构中分离出来:
# vxsnap [-g diskgroup] dis volume3.使用以下命令启动卷:
# vxvol [-g diskgroup] start volume4.再次运行失败的 reattach 或 refresh 命令。
注意这将完全重同步卷。或者选择在需要时删除快照卷并重新创建它。
写入时复制失败
如果执行内部的卷快照重同步时遇到错误,则快照卷变为 INVALID 状态,并且无法用于 I/O 存取和即时快照操作。使用以下步骤修复快照卷:
1.使用 vxsnap 命令将卷从快照分层结构中分离出来:
# vxsnap [-g diskgroup] dis snapshot_volume2.使用以下命令取消卷的准备:
# vxsnap [-g diskgroup] unprepare snapshot_volume第 2 章“从即时快照操作故障中修复”
23
重同步过程中的 I/O 错误
3.使用以下命令准备卷:
# vxsnap [-g diskgroup] prepare volume [ndcomirs=number] \\
[regionsize=size] [drl=yes|no|sequential] \\[storage_attribute ...]
有关如何使用 vxsnap prepare 命令的全部详细信息,请参见《VERITAS Volume Manager 管理员指南》和 vxsnap (1M) 手册页。该卷现在可以再次用于快照操作。或者选择在需要时删除快照卷并重新创建它。
重同步过程中的 I/O 错误
如果发生 I/O 错误,就会停止快照重同步(通过 vxsnap syncstart 或为 vxsnap 指定 sync=on 启动),并且在系统控制台上显示以下信息:
VxVM vxsnap 错误 V-5-1-6840 卷 volume 的同步由于 I/O 错误而停止在纠正错误源后,使用以下命令重新启动重同步操作:
# vxsnap [-b] [-g diskgroup] syncstart volume有关如何使用 vxsnap syncstart 命令的全部详细信息,请参见《VERITAS Volume Manager 管理员指南》和 vxsnap (1M) 手册页。
DCO 卷上的 I/O 故障
如果 DCO 卷上发生 I/O 故障,则无法访问它的快速重同步映射和 DRL 日志,并且该 DCO 卷被用 BADLOG 标志做了标记。除非使用第16页的“从 DCO 卷故障中修复”中描述的过程修复卷的 DCO 卷,否则无法对该卷执行 DRL 日志记录与修复以及即时快照操作。
注意如果 I/O 故障还影响数据卷,则必须先修复数据卷,然后才能修复其 DCO 卷。
24VERITAS Volume Manager 故障排除指南记录命令和事务
3
本章介绍如何在 VERITAS Volume Manager (VxVM) 中管理命令和事务的日志记录。有关如何管理错误日志记录的信息,请参见第35页的“错误信息”。
记录命令
使用 vxcmdlog 命令可以将其他 VxVM 命令的调用操作记录到文件中。下表说明 vxcmdlog 的用法:
命令
说明
列出命令日志记录的当前设置。打开命令日志记录功能。
将最大命令日志文件大小设置为 512KB。将最大历史命令日志文件数设置为 10。取消对历史命令日志文件数的。关闭命令日志记录功能。
vxcmdlog -lvxcmdlog -m onvxcmdlog -s 512kvxcmdlog -n 10vxcmdlog -n no_limitvxcmdlog -m off
命令行被记录到 /etc/vx/log 目录下的 cmdlog 文件中。此路径名是一个指向目录的符号链接,目录的位置与操作系统有关。必要时可以重新定义所链接的目录。如果需要保留 vxcmdlog 公用程序的设置,还必须将设置文件 .cmdlog 复制到新的目录。注意.cmdlog 文件是一个二进制文件,不应对其进行编辑。
在写入一个条目(因此导致实际大小可能略大于指定的大小)之后,系统将检查命令日志的大小。当日志达到最大空间时,当前命令日志文件 cmdlog 被重命名为下一个可用的历史日志文件 cmdlog.number(其中 number 是一个整数,其范围为从 1 到当前定义的最大历史日志文件数),并且新创建一个当前日志文件。
25
记录命令
为了避免写满文件系统,系统仅保留有限数量的历史日志文件。如果达到最大历史日志文件数,则删除最早的历史日志文件,并将当前的日志文件重命名为该文件。
每个日志文件都包含一个标头,其中记录了主机名、主机 ID 以及日志的创建日期和时间。下面是摘自一个命令日志文件的示例条目:
# 0, 2329, Wed Feb 12 21:19:31 2003/usr/sbin/vxdctl mode
# 17051, 2635, Wed Feb 12 21:19:33 2003/usr/sbin/vxdisk -q -o alldgs list# 0, 2722, Wed Feb 12 21:19:34 2003
/etc/vx/diag.d/vxprivutil dumpconfig /dev/vx/rdmp/Disk_4s2 # 26924, 3001, Thu Feb 13 19:30:57 2003/usr/sbin/vxdisk list Disk_1
每个条目通常包含客户机 ID(标识 vxconfigd 后台驻留程序的命令连接)、当前运行的命令的进程 ID、时间戳以及包含任何参数的命令行。
如果客户机 ID 是 0(如上例中的第三条),则说明该命令未打开与 vxconfigd 的连接。注意该客户机 ID 与在事务日志中为相应事务记录的客户机 ID 相同。有关更多信息,
请参见第27页的“记录事务”和第28页的“关联命令日志和事务日志”。
大多数命令脚本不会被记录,但它们调用的命令二进制文件会被记录。
vxdisksetup、vxinstall 和 vxdiskunsetup 脚本例外,系统会记录这些脚本。
如果读取设置文件时发生错误,命令日志记录将切换到内置的默认设置。这可能意味着某些情况,例如在使用 vxcmdlog -m off 命令禁用日志记录后,日志记录仍保持启用状态。如果发生这种情况,请使用 vxcmdlog 公用程序重新创建设置文件,或使用备份恢复此文件。
有关 vxcmdlog 公用程序的更多信息,请参见 vxcmdlog(1M) 手册页。
26VERITAS Volume Manager 故障排除指南记录事务
记录事务
可以使用 vxtranslog 命令将 VxVM 事务记录到文件中。下表说明 vxtranslog 的用法:
命令
说明
列出事务日志记录的当前设置。打开事务日志记录功能。
将最大事务日志文件大小设置为 512KB。将最大历史事务日志文件数设置为 10。取消对历史事务日志文件数的。打开查询日志记录功能。关闭查询日志记录功能。关闭事务日志记录功能。
vxtranslog -lvxtranslog -m onvxtranslog -s 512kvxtranslog -n 10vxtranslog -n no_limitvxtranslog -q onvxtranslog -q offvxtranslog -m off
事务被记录到 /etc/vx/log 目录下的 translog 文件中。此路径名是一个指向目录的符号链接,目录的位置与操作系统有关。必要时可以重新定义所链接的目录。如果要保留 vxtranslog 公用程序的设置,还必须将设置文件 .translog 复制到新的目录。注意.translog 文件是一个二进制文件,不应对其进行编辑。
在写入一个条目(因此导致实际大小可能略大于指定的大小)之后,系统将检查事务日志的大小。当该日志达到最大空间时,当前事务日志文件 translog 将被重命名为下一个可用的历史日志文件 translog.number(其中 number 是一个整数,其范围为从 1 到当前定义的最大历史日志文件数),并且新创建一个当前日志文件。为了避免写满文件系统,系统仅保留有限数量的历史日志文件。如果达到最大历史日志文件数,则删除最早的历史日志文件,并将当前的日志文件重命名为该文件。
每个日志文件都包含一个标头,其中记录了主机名、主机 ID 以及日志的创建日期和时间。
第 3 章 记录命令和事务
27
关联命令日志和事务日志
下面是摘自一个事务日志文件的示例条目:
Thu Feb 13 19:30:57 2003
Clid = 26924, PID = 3001, Part = 0, Status = 0, Abort Reason = 0
DA_GET SENA0_1
DISK_GET_ATTRS SENA0_1DISK_DISK_OP SENA0_1 8 DEVNO_GET SENA0_1
DANAME_GET 0x1d801d8 0x1d801a0
GET_ARRAYNAME SENA 50800200000e78b8
CTLR_PTOLNAME /pci@1f,4000/pci@5/SUNW,qlc@4/fp@0,0GET_ARRAYNAME SENA 50800200000e78b8
CTLR_PTOLNAME /pci@1f,4000/pci@5/SUNW,qlc@5/fp@0,0DISCONNECT 每个日志条目的第一行是事务的时间戳。Clid 字段与该命令打开的 vxconfigd 连接的客户机 ID 相对应。PID 字段显示正在请求操作的公用程序的进程 ID。如果事务未正常完成,Status(状态)和 Abort Reason(中止原因)字段将包含错误代码。记录的其余部分将显示处理事务时使用的数据。 注意该客户机 ID 与在命令日志中为对应命令行所记录的客户机 ID 相同。有关更多信息, 请参见第25页的“记录命令”和第28页的“关联命令日志和事务日志”。 如果读取设置文件时发生错误,事务日志记录将切换到内置的默认设置。这可能意味着某些情况,例如在使用 vxtranslog -m off 命令禁用日志记录后,日志记录仍保持启用状态。如果发生这种情况,请使用 vxtranslog 公用程序重新创建设置文件,或使用备份恢复此文件。 关联命令日志和事务日志 为每个请求和命令记录的客户机 ID 和进程 ID 可帮助您将命令日志和事务日志中的条目关联起来。要确定事务日志中的某个请求是哪个命令发出的,可使用如下命令在命令日志中搜索进程 ID 和客户机 ID: # egrep -n PID cmdlog | egrep Clid 在本例中,事务日志内记录了以下请求: Wed Feb 12 21:19:36 2003 Clid = 8309, PID = 2778, Part = 0, Status = 0, Abort Reason = 0 DG_IMPORT foodgDG_IMPORT foodg DISCONNECT 28VERITAS Volume Manager 故障排除指南关联命令日志和事务日志 要找到发出此请求的公用程序,可使用如下命令: # egrep -n 2778 cmdlog | egrep 8309 7310:# 8309, 2778, Wed Feb 12 21:19:36 2003 该示例输出表明命令日志第 7310 行上存在匹配项。通过检查命令日志中的第 7310 行和 7311 行发现,系统对 foodg 磁盘组运行过 vxdg import 命令: # sed -e '7310,7311!d' cmdlog # 8309, 2778, Wed Feb 12 21:19:36 2003 7311/usr/sbin/vxdg -m import foodg 注意如果客户机 ID 和进程 ID 的组合有多个匹配项,可以通过检查时间戳来确定正确的 匹配项。 当公用程序打开与 vxconfigd 的条件连接时,其客户机 ID 在命令日志中显示为零,而在事务日志中显示为非零值。这种情况下,可以使用进程 ID 和时间戳关联日志条目。 第 3 章 记录命令和事务 29 关联命令日志和事务日志 30VERITAS Volume Manager 故障排除指南备份和恢复磁盘组配置 4 备份和恢复磁盘组配置的功能用于备份和恢复 VERITAS Volume Manager (VxVM) 磁盘组以及在磁盘组内配置的 VxVM 对象(例如卷)的所有配置数据。利用此功能,您可以修复损坏的、以元数据形式存储在 VM 磁盘专用区域中的磁盘组配置。当恢复磁盘组配置并启用卷后,您不必从备份介质中恢复,公共区域中的用户数据就又可以使用了。 警告备份和恢复公用程序仅对 VxVM 配置数据起作用。它们不备份或恢复卷或其他 VxVM 对象中包含的任何用户数据或应用程序数据。如果对磁盘使用 vxdiskunsetup 和 vxdisksetup,并指定与配置备份中不同的属性,可能会损坏公共区域和其中的所有用户数据。vxconfigbackupd 后台驻留程序监视对 VxVM 配置所做的更改,并自动记录发生的任何配置更改。vxconfigbackup 和 vxconfigrestore 这两个公用程序可以用来备份和恢复磁盘组的 VxVM 配置。 导入磁盘组时,如果发生以下任何错误,则说明磁盘组配置和/或磁盘专用区域头文件已损坏: VxVM vxconfigd 错误 V-5-1-569 磁盘组 group、磁盘 disk:无法自动导入组:reason 该错误的 reason 通常是以下项目之一: 配置记录不一致 磁盘组没有有效的配置副本配置中的记录重复某些配置副本出错配置副本中的格式错误无效块数无效幻数 如果 VxVM 因磁盘出错而无法更新磁盘组配置,它将禁用该磁盘组并显示以下错误:VxVM vxconfigd 错误 V-5-1-123 磁盘组 group:因发生错误而禁用 如果出现这样的错误,可以在解决根本问题(如硬件故障或连接断开)后从备份恢复磁盘组配置。 31 备份磁盘组配置 使用备份中的配置数据,您可以重新安装磁盘组中头文件损坏的 VxVM 磁盘的专用区域头文件,重新创建损坏的磁盘组配置,或者重新创建磁盘组和磁盘组中的 VxVM 对象。如果原来的系统不可用,您还可以使用配置数据在其他系统上重新创建磁盘组。 注意要恢复磁盘组配置,所使用的物理磁盘必须与在执行备份时在磁盘组中配置的物理 磁盘相同。以下各节介绍如何备份和恢复磁盘组配置。 备份磁盘组配置 VxVM 使用磁盘组配置后台驻留程序来监视磁盘组的配置,并在配置发生变化时随时备份。默认情况下,系统将保留最近的五个备份。必要时您还可以通过运行 vxconfigbackup 命令来备份磁盘组配置。下表对记录磁盘组配置信息的文件进行了说明: 备份文件 /etc/vx/cbr/bk/diskgroup dgid /dgid.dginfo/etc/vx/cbr/bk/diskgroup.dgid/dgid .diskinfo/etc/vx/cbr/bk/diskgroup dgid/dgid .binconfig/etc/vx/cbr/bk/diskgroup.dgid/dgid.cfgrec 说明 磁盘组信息。磁盘属性。二进制配置副本。 vxprint -m 格式的配置记录。 其中 diskgroup 是磁盘组的名称,dgid 是磁盘组 ID。如果要在其他系统上重新创建磁盘组,请将这些文件复制到该系统上。 警告请注意不要覆盖目标系统上由该系统中的磁盘组使用的任何文件。要手动备份磁盘组,请使用以下命令: # /etc/vx/bin/vxconfigbackup diskgroup要备份所有磁盘组,请使用此版本的命令: # /etc/vx/bin/vxconfigbackup 有关更多信息,请参见 vxconfigbackup(1M) 手册页。 32VERITAS Volume Manager 故障排除指南恢复磁盘组配置 恢复磁盘组配置 可以使用 vxconfigrestore 公用程序从磁盘组的配置备份中恢复或重新创建磁盘组。恢复过程分为两个阶段:预提交 和提交。在预提交阶段,您可以检查将从备份中恢复的磁盘组配置。在您选择提交更改后,实际的磁盘组配置才永久恢复。 注意在执行恢复时,磁盘组中的任何磁盘或 VxVM 对象不能被任何应用程序打开或 使用。可以选择是否在此阶段重新安装损坏的磁盘头文件。如果有任何磁盘的专用区域头文件无效,就必须重新安装受影响的磁盘的头文件,否则恢复可能无法进行。 以下命令执行磁盘组配置状态的预提交分析,并在头文件已损坏的磁盘上重新安装磁盘头文件: # /etc/vx/bin/vxconfigrestore -p [-l directory] {diskgroup | dgid} 可以通过名称或 ID 来指定磁盘组。 使用 -l 选项可以为备份配置文件指定一个默认位置 /etc/vx/cbr/bk 以外的目录。有关详细信息,请参见第 32 页的“备份磁盘组配置”。要指定不重新安装磁盘头文件,请使用以下命令形式: # /etc/vx/bin/vxconfigrestore -n [-l directory] {diskgroup | dgid} 在预提交阶段,可以使用 vxprint 命令检查所恢复的磁盘组将具有的配置。可以选择继续提交更改并恢复磁盘组配置,也可以在做出任何永久更改之前取消恢复。要在预提交阶段放弃恢复,请使用以下命令: # /etc/vx/bin/vxconfigrestore -d [-l directory] {diskgroup | dgid} 要提交恢复磁盘组配置所需的更改,请使用以下命令: # /etc/vx/bin/vxconfigrestore -c [-l directory] {diskgroup | dgid} 如果没有重新安装任何磁盘头文件,则磁盘专用区域中的配置副本会从为磁盘组保存的最新二进制配置副本进行更新。 如果重新安装了磁盘头文件,则会使用磁盘属性的已保存副本重新创建其专用区域和公共区域。系统还会为这些磁盘分配新的磁盘 ID。然后,使用磁盘组的备份配置记录重新创建磁盘组中的 VxVM 对象。此过程还将在磁盘组中创建新配置副本。 卷在后台同步。对于大卷的配置,执行同步可能需要一些时间。可以使用 vxtask -l list 命令监视此操作的进度。 注意正在使用或布局已更改的磁盘不会包括在恢复过程中。有关更多信息,请参见 vxconfigrestore(1M) 手册页。 第 4 章“备份和恢复磁盘组配置” 33 恢复磁盘组配置 解决磁盘组的冲突备份 有时,系统上的磁盘已更换,磁盘组可能有几个冲突备份。在这种情况下,vxconfigrestore 命令会显示如下信息: VxVM vxconfigrestore 错误 V-5-1-6012 有两个磁盘组名称相同而磁盘组 ID 不同的备份: 1047336696.19.xxx.veritas.com10491352.31.xxx.veritas.com 解决办法是通过 ID(而不是名称)来指定要执行恢复的磁盘组。备份文件 /etc/vx/cbr/bk/diskgroup. dgid/ dgid.dginfo 中包含记录备份时间的时间戳。下面是来自一个备份文件的示例,其中显示了时间戳和磁盘组 ID 信息: TIMESTAMP Tue Apr 15 23:27:01 PDT 2003 ... DISK_GROUP_CONFIGURATIONGroup:mydg dgid:1047336696.19.xxx.veritas.com... 借助时间戳信息确定哪个备份包含相关信息,然后使用 vxconfigrestore 命令指定磁盘组 ID(而不是磁盘组名称)来恢复配置。 34VERITAS Volume Manager 故障排除指南错误信息 5 本章提供与 VERITAS Volume Manager (VxVM) 配置后台驻留程序 (vxconfigd)、内核和其他公用程序相关的错误信息。内容涵盖 vxconfigd 和 VERITAS Volume Manager 内核驱动程序 vxio 在控制台上显示的大多数信息性信息、故障信息和错误信息,其中包括一些不常见的和难以解决的错误。 注意这里描述的某些错误信息可能不适用于您的系统。 本章对引发具体错误信息的情况或问题进行了详细阐述,并尽可能提供了修复过程(操作),有助于找出并解决问题。您可能会发现参考 VxVM 命令和事务日志对了解错误发生的环境很有用。有关更多信息,请参见第25页的“记录命令和事务”。 记录错误信息 VxVM 提供了将控制台输出记录到文件的选项。此日志记录功能很有用,因为系统崩溃前的任何信息输出都会记录在日志文件中(假定崩溃未导致文件系统损坏)。 vxconfigd 用于控制是否打开此日志记录功能。如果启用,则默认日志文件为 /var/vxvm/vxconfigd.log。 vxconfigd 还支持使用 syslog 来记录所有常规控制台信息。启用此功能后,所有控制台输出都通过 syslog 接口定向。 可将 syslog 与日志文件记录结合起来使用,以便提供可靠的日志记录(记入专用日志文件),以及通过 syslogd 进行的分布式日志记录。 注意默认情况下启用 syslog 日志记录,禁用日志文件记录。 要使控制台输出能够记录到文件 /var/vxvm/vxconfigd.log 中,请按“在启动脚本中配置日志记录”, 中的说明编辑 vxconfigd 的启动脚本,或者使用以下命令在 C 语言环境中调用 vxconfigd: # vxconfigd [-x [1-9]] -x log 35 在启动脚本中配置日志记录 有 9 种可能的调试日志记录级别;1 提供的信息最少,9 提供的信息最多。要启用控制台输出的 syslog 日志记录,请在 C 语言环境下指定 vxconfigd 的 -x syslog 选项,如下所示: # vxconfigd [-x [1-9]] -x syslog 优先级高于“调试”的信息被写入 /var/adm/syslog/syslog.log,所有其他的信息被写入 /var/vxvm/vxconfigd.log。如果不指定调试级别,则只记录“错误”、“致命错误”、“警告”和“通知”信息。不记录“调试”信息。 在启动脚本中配置日志记录 要启用日志文件或 syslog 日志记录,可以编辑 /etc/init.d/vxvm-sysboot 脚本的以下内容,这部分内容启动 VxVM 配置后台驻留程序 vxconfigd: # comment-out or uncomment any of the following lines to enable or# disable the corresponding feature in vxconfigd. opts=”$opts -x syslog” # use syslog for console messages#opts=”$opts -x log” # messages to vxconfigd.log #opts=”$opts -x logfile=/foo/bar” # specify an alternate log file#opts=”$opts -x timestamp” # timestamp console messages# To turn on debugging console output, uncomment the following line.# The debug level can be set higher for more output. The highest# debug level is 9.#debug=1 # enable debugging console output 注释或取消注释要在启动时禁用或启用的功能所对应的行。例如,默认情况下,通常取消注释 opts=\"$opts -x syslog\" 字符串,以便 vxconfigd 使用 syslog 日志记录。在行首插入 # 字符将禁用 vxconfigd 的 syslog 记录。 注意默认情况下,引导时使用 -x syslog 选项启动 vxconfigd。这会将 vxconfigd 控 制台信息重定向到 syslog。如果希望在从命令行重新启动 vxconfigd 时保留此行为,请包括 -x syslog 参数,因为重新启动 vxconfigd 时不保留它以前运行时所使用的选项设置。同样,任何要求重新启动 vxconfigd 的 VERITAS Volume Manager 操作都可能不保留以前由选项设置指定的行为。有关 vxconfigd 的日志记录选项的更多信息,请参考 vxconfigd(1M) 手册页。 36VERITAS Volume Manager 故障排除指南了解错误信息 了解错误信息 VxVM 具有容错能力,不需要系统管理员干预就可以解决大多数问题。如果配置后台驻留程序 (vxconfigd) 识别出必须执行的操作,就会将所需的事务进行排队。VxVM 提供系统配置的原子更改:即要么事务处理全部完成,要么系统保留在似乎从未尝试过处理事务的状态。如果 vxconfigd 无法识别和解决系统问题,系统管理员就需要处理一些任务,即使用软件返回的诊断信息来解决问题。以下各节介绍了可能出现的错误信息编号和错误信息类型,并提供了常见错误列表、问题的可能起因的详细说明以及可采取的措施的建议。 错误信息一般具有以下格式: product component severity message_number message_text对于 VERITAS Volume Manager,product 设置为 VxVM。component 可以是内核模块或驱动程序的名称(如 vxdmp)、配置后台驻留程序(如 vxconfigd)或命令(如 vxassist)。按照对系统影响程度由重到轻的顺序,将错误信息划分为以下几种严重性类型: ◆ 告急 告急是一种严重事件,因为此类事件会在系统正常操作时停止系统。来自内核模块或 设备驱动程序的告急信息表明,硬件问题或软件不一致问题非常严重,以致系统无法继续运行。操作系统可能还提供了 CPU 寄存器内容转储及堆栈跟踪,以帮助确定告急的原因。下面是此类信息的示例: VxVM vxio 告急 V-5-0-239 对象关联深度溢出 注意有关保存系统崩溃信息的所有信息,请参见《Solaris 系统管理指南》。 ◆ 致命错误 来自配置后台驻留程序(如 vxconfigd)的致命错误信息表明 VxVM 操作中出现妨碍其运行的严重问题。下面是此类信息的示例: VxVM vxconfigd 致命错误 V-5-0-591 磁盘组 bootdg:不一致 -- 未装入内核 ◆ 错误 来自命令的错误信息表明无法正确执行请求的操作。下面是此类信息的示例: VxVM vxassist 错误 V-5-1-5150 snapshot_volume 中活动快照镜像的数量不足。 ◆ 警告 来自内核的警告信息表明非关键操作失败,原因可能是某些资源不可用或者无法执行该操作。下面是此类信息的示例: VxVM vxio 警告 V-5-0-55 无法找到 boot_path 的设备编号 第 5 章 错误信息 37 了解错误信息 ◆ 通知 通知信息表明发生了应该监视的错误。尽管可能需要以后采取措施纠正错误,但不必马上关闭系统。下面是此类信息的示例: VxVM vxio 通知 V-5-0-252 镜像 plex(位于卷 volume 中,该卷开头为 offset、长度为 length)的对象 subdisk 的读取错误已经纠正。 ◆ 信息 信息性消息不表示错误,并且不需要采取措施。 唯一消息编号由以字母“V”开头的字母数字字符串组成。例如,在消息编号 V-5-1-3141 中,“V”表示这是 VERITAS 产品错误信息,第一个数字字段 (5) 表示产品代码(这里是 VxVM),第二个字段 (1) 表示有关产品组件的信息,第三个字段 (3141) 是消息索引。错误信息的正文在唯一消息编号后列出。 错误信息 本节提供在 VERITAS Volume Manager 操作过程中可能遇到的错误信息的列表。但是,该列表的内容不够详尽,并且第二个字段中可能包含不同于这里显示的命令、驱动程序或模块的名称。 如果您遇到产品错误信息,请记下消息文本前面的唯一消息编号。通过电话或访问 VERITAS 技术支持网站与 VERITAS 技术支持部门联系时,请务必提供相关的消息编号。VERITAS 技术支持部门将使用此消息编号迅速确定有无适合您的 TechNote 或其他信息。 V-5-0-2 VxVM vxio 警告 V-5-0-2 object_type object_name 块 offset:无法纠正的读取错误...VxVM vxio 警告 V-5-0-2 object_type object_name 块 offset:无法纠正的写入错误... ◆◆ 描述:对指定的 VERITAS Volume Manager 对象执行的读取或写入操作失败。系统将 错误返回给应用程序。 根据具体的对象故障类型和推荐用于该对象类型的修复类型,可能需要执行相应的修复操作。 操作:这些错误可能表示丢失了数据。可能需要恢复数据并修复或更换出错的介质。 38VERITAS Volume Manager 故障排除指南了解错误信息 V-5-0-4 VxVM vxio 警告 V-5-0-4 plex plex 从卷 volume 中分离 ◆◆ 描述:镜像代码检测到无法纠正的错误,并且镜像副本已分离。 磁盘。 操作:要恢复冗余,可能有必要添加另一个镜像。应重新格式化或更换发生故障的 注意在集群中执行 plex 分离操作时,也可能会出现此信息。此时无须执行任何操作。 V-5-0-34 VxVM vxdmp 通知 V-5-0-34 已添加磁盘阵列 disk_array_serial_number ◆◆ 描述:一个新的磁盘阵列已添加到主机。操作:无。 V-5-0-35 VxVM vxdmp 通知 V-5-0-35 试图禁用控制器 controller_name 失败。根磁盘只有一条启用路径。 ◆◆ 描述:试图禁用所剩的唯一一条到达根磁盘控制器的活动路径。操作:不能禁用该路径。 V-5-0-55 VxVM vxio 警告 V-5-0-55 无法找到 boot_path 的设备编号vxvm vxdmp 警告 V-5-0-55 找不到 boot_path 的设备编号 ◆◆ 描述:无法将从系统 PROM 中检索到的引导路径转换为有效的设备编号。操作:检查 PROM 设置以确定正确的引导字符串。 如果有目标驱动程序(如 ATF)与 VxVM 共存,并且该目标驱动程序已将引导磁盘归类,那么在设备路径与该引导磁盘相对应时可以忽略此信息。 第 5 章 错误信息 39 了解错误信息 V-5-0- VxVM vxio 警告 V-5-0- 无法记录磁盘组 bootdg 的提交记录:错误 28 ◆◆ 描述:通常意味着多径处理的配置不正确。 操作:有关可能的原因和解决方法,请参见第71页的“V-5-1-5929”。 V-5-0-106 VxVM vxio 警告 V-5-0-106 正在分离 RAID-5 volume ◆◆ 描述:在内核中检测到 RAID-5 卷中的双重故障情况,或者有其他某些致命错误正妨 碍进一步使用阵列。 系统后,应使用 vxrecover 公用程序修复这些磁盘。查看控制台上的其他错误信息,它们可能提供了有关故障的附加信息。 操作:如果由于控制器或电源故障导致两个或更多的磁盘丢失,则将磁盘重新挂接到 V-5-0-108 VxVM vxio 警告 V-5-0-108 设备 major、minor:接收到虚假的关闭指令 ◆◆ 指令时,才会发生此错误。 描述:收到关闭一个未曾打开的对象的指令。仅当操作系统没有正确跟踪打开和关闭操作:没有必要采取操作;系统将继续运行。 V-5-0-110 VxVM vxdmp 通知 V-5-0-110 已禁用连接到磁盘阵列 disk_array_serial_number 的控制器 controller_name ◆◆ 控制器的情况中。 描述:通过控制器连接到磁盘阵列的所有路径都被禁用。这通常发生在为维护而禁用操作:无。 V-5-0-111 VxVM vxdmp 通知 V-5-0-111 已禁用 dmpnode dmpnode_device_number ◆ 能再访问该节点。当由 DMP 节点控制的所有路径均处于禁用状态并因此而不可访问时,将会发生这种情况。 ◆ 描述:DMP 数据库中的一个 DMP 节点已被标记为禁用。对于以后的 IO 请求,将不 操作:检查硬件或启用适当的控制器,以启用此 DMP 节点下的至少一条路径。 40VERITAS Volume Manager 故障排除指南了解错误信息 V-5-0-112 VxVM vxdmp 通知 V-5-0-112 已禁用属于 dmpnode dmpnode_device_number 的路径 path_device_number ◆◆ DMP 节点控制。这可能是由于硬件故障所致。 描述:DMP 数据库中的一条路径已被标记为禁用。此路径由指定的设备编号所表示的 操作:要修复所需的路径,请检查基础硬件。 V-5-0-144 VxVM vxio 警告 V-5-0-144 在 RAID-5 volume 上检测到双重故障情况 ◆ 描述:在 RAID-5 卷的多个列中收到 I/O 错误。可能的原因包括: ◆◆◆ 发生使多个驱动器不可用的控制器故障在退化模式下运行时第二驱动器丢失 两个的磁盘驱动器同时发生故障(不太可能)。 ◆ 操作:如果可能,先纠正硬件故障。然后使用 vxrecover 命令修复卷。 V-5-0-145 VxVM vxio 警告 V-5-0-145 DRL 卷 volume 已分离 ◆◆ 描述:由于无法写入 DRL 日志项,脏区日志卷已分离。如果这是由于介质故障导致 的,则可能有其他错误信息记录到控制台上。 完全修复卷的内容,这将在系统重新启动时自动执行。要从此错误修复,请使用 vxassist addlog 命令向该卷添加新的 DRL 日志。 操作:包含 DRL 日志的卷将继续工作。如果在修复 DRL 之前系统失败,则可能必须 V-5-0-146 VxVM vxdmp 通知 V-5-0-146 已启用连接到磁盘阵列 disk_array_serial_number 的控制器 controller_name ◆◆ 制器的情况中。 描述:通过控制器连接到磁盘阵列的所有路径均被启用。这通常发生在维护后启用控操作:无。 第 5 章 错误信息 41 了解错误信息 V-5-0-147 VxVM vxdmp 通知 V-5-0-147 已启用 dmpnode dmpnode_device_number ◆◆ 一条路径被启用时,会发生这种情况。 描述:DMP 数据库中的一个 DMP 节点已被标记为启用。当由 DMP 节点控制的至少操作:无。 V-5-0-148 VxVM vxdmp 通知 V-5-0-148 已启用属于 dmpnode dmpnode_device_number 的路径 path_device_number ◆ DMP 节点控制。如果以前禁用的路径已修复,用户使用 vxdctl(1M) 命令重新配置了 DMP 数据库,或者 DMP 数据库已被自动重新配置,则会发生此情况。 ◆ 描述:DMP 数据库中的一条路径已被标记为启用。此路径由指定的设备编号所表示的 操作:无。 V-5-0-1 VxVM vxio 警告 V-5-0-1 无法加入集群 name,正在中止 ◆◆ 他错误信息可能提供了有关未找到的磁盘的更多信息。 描述:某个节点无法加入集群。这可能是由于该节点无法看到所有共享磁盘所致。其操作:在主节点上使用 vxdisk -s list 命令,确定从属节点可以看到哪些磁盘。然 后,检查操作系统和出错的节点上的 VxVM 是否也可以看到这些磁盘。如果操作系统看不到这些磁盘,请检查节点的电缆和硬件配置。如果只有 VxVM 看不到这些磁盘,请使用 vxdctl enable 命令让它再次扫描磁盘。当节点上的 VxVM 可以看到这些磁盘时,请重试加入。 V-5-0-166 VxVM vxio 警告 V-5-0-166 未能记录 DRL 卷 volume 的分离 ◆◆ 描述:写入内核日志项(指出 DRL 卷丢失)的尝试失败。由于内核日志已满或出现对 驱动器的写错误,因此尝试写入日志失败。该卷已分离。 足够的冗余度,不太可能发生此错误。 操作:除非问题为瞬态的,否则有关日志失败的信息通常是致命的。但是内核日志有 如果问题不是瞬态的(即无法修复驱动器并使其联机而无数据丢失),则必须从头开始重新创建磁盘组并从备份中恢复该磁盘组的所有卷。即使问题是瞬态的,纠正问题后也必须重新启动系统。 42VERITAS Volume Manager 故障排除指南了解错误信息 如果是从磁盘驱动程序看到错误信息,则可能是由于磁盘错误导致日志的最后副本失败。更换磁盘组中出错的驱动器。日志会在新的驱动器上重新初始化。最后强制出错卷进入活动状态并修复数据。 V-5-0-168 VxVM vxio 警告 V-5-0-168 RAID-5 日志操作中发生故障 ◆◆ 描述: 表示 RAID-5 日志失败。 接到卷。 操作:要恢复对 RAID-5 卷的 RAID-5 日志记录,请创建一个新的日志 plex 并将其挂 V-5-0-181 VxVM vxio 警告 V-5-0-181 遇到非法 vminor ◆◆ 描述:试图在加载卷配置之前打开 vxconfigd。 新尝试操作。 操作:无;在正常启动条件下,应该不会出现此信息。如有必要,可启动 VxVM 并重 V-5-0-194 VxVM vxio 警告 V-5-0-194 内核日志已满:volume 已分离 ◆◆ 描述:plex 分离因内核日志已满而失败。结果,镜像卷将分离。操作:此情况不太可能发生。唯一的纠正操作是重新启动系统。 V-5-0-196 VxVM vxio 警告 V-5-0-196 内核日志更新失败:volume 已分离 ◆◆ 包含内核日志的磁盘全部损坏可能会导致该错误。 描述:由于无法将内核日志刷新到磁盘,plex 分离失败。作为结果,镜像卷将分离。操作:修复或更换出错的磁盘,以便内核日志记录可以恢复工作。 V-5-0-207 VxVM vxio 警告 V-5-0-207 日志对象 object_name 从 RAID-5 卷中分离 ◆◆ 描述: 表示 RAID-5 日志失败。 接到卷。 操作:要恢复对 RAID-5 卷的 RAID-5 日志记录,请创建一个新的日志 plex 并将其挂 第 5 章 错误信息 43 了解错误信息 V-5-0-216 VxVM vxio 警告 V-5-0-216 mod_install 返回 errno ◆◆ 描述:调用操作系统 mod_install 函数以装入 vxio 驱动程序的尝试失败。 志文件,查看已记录但没有在控制台上显示的任何其他信息。 操作:检查是否有其他的控制台信息可解释装入失败的原因。同时检查控制台信息日 V-5-0-237 VxVM vxio 警告 V-5-0-237 object subdisk 从 RAID-5 volume(列为 column,偏移量为 offset)中分离 ◆◆ 描述:因磁盘故障或发生在磁盘上的无法纠正的错误而导致子磁盘从 RAID-5 卷分离。操作:检查是否有其他指出故障原因的控制台错误信息。尽快更换所有出错的磁盘。 V-5-0-243 VxVM vxio 警告 V-5-0-243 重叠镜像 plex 从卷 volume 中分离 ◆◆ 离,因此无法访问这些稀疏镜像,因而也就不能保持故障区域的一致性。 描述:镜像卷中最后一个完整 plex 上发生错误。映射故障区域的所有稀疏镜像均被分操作:该信息表示,故障区域中的某些数据可能不再是冗余存储的。 V-5-0-244 VxVM vxdmp 通知 V-5-0-244 有关 major/minor 的路径故障 ◆◆ 次要设备编号。 描述:DMP 驱动程序控制下的一条路径发生故障。信息中提供了出错的设备的主要和操作:无。 V-5-0-249 VxVM vxio 警告 V-5-0-249 RAID-5 volume 进入退化模式操作 ◆ 请求的数据而存在。相反,需要使用奇偶校验区域来重新生成阵列中每个条带的数据。因此,访问时间就会更长,并且涉及从条带中的所有驱动器中进行读取。 ◆ 描述:不可纠正的错误已强制子磁盘分离。此时,并非所有的数据磁盘都是为了提供 操作:检查是否有其他指出故障原因的控制台错误信息。尽快更换所有出错的磁盘。 44VERITAS Volume Manager 故障排除指南了解错误信息 V-5-0-251 VxVM vxio 警告 V-5-0-251 在镜像 plex(位于卷 volume 中,该卷开头为 offset、长度为 length)的对象 object 上发生读取错误 ◆◆ 息中显示)。 描述:读取镜像时检测到错误。此错误可能导致执行进一步的操作(在稍后的错误信操作:如果卷已镜像,则不需要执行进一步的操作,因为备用镜像的内容将写入出错 的镜像中;这通常可满足纠正介质故障的需要。如果经常发生此错误但从不导致 plex 分离,则位于所指出位置的磁盘上可能存在边缘缺陷区域。最终可能需要从该磁盘中删除数据(请参见 vxevac(1M) 手册页),然后重新格式化驱动器。 如果卷未镜像,则此信息表明无法读取某些数据。文件系统或其他读取这些数据的应用程序可能会报告其他错误,但无论哪种情况,数据均已丢失。如果愿意,可以部分地抢救卷,将其移动到其他位置。 注意在集群中执行 plex 分离操作时,也可能会出现此信息。此时无须执行任何操作。 V-5-0-252 VxVM vxio 通知 V-5-0-252 镜像 plex(位于卷 volume 中,该卷开头为 offset,长度为 length)的对象 subdisk 上的读取错误已经纠正 ◆◆ 了磁盘上的数据。 描述:发生读取错误,该错误导致读取备用镜像并写回故障区域。写回成功并且纠正操作:无;此问题已自动纠正。请记下故障的位置供将来参考。如果子磁盘的同一区 域再次发生故障,这可能表明一个更隐蔽的故障,因此应在下一个合理的时机重新格式化磁盘。 V-5-0-258 VxVM vxdmp 通知 V-5-0-258 已删除磁盘阵列 disk_array_serial_number ◆◆ 描述:磁盘阵列已从主机断开,或某个硬件故障导致该磁盘阵列变为不可由主机访问。操作:更换磁盘阵列硬件(如果已发生故障)。 V-5-0-386 VxVM vxio 警告 V-5-0-386 plex plex(位于卷 volume)中的子磁盘 subdisk 发生故障 ◆◆ 描述:内核检测到子磁盘故障,这可能意味着基础磁盘发生故障。 故障时,系统会自动处理从子磁盘故障中的修复。 操作:检查磁盘是否有明显问题(如电缆断开)。如果启用了热重定位,当磁盘发生 第 5 章 错误信息 45 了解错误信息 V-5-1-90 VxVM vxconfigd 错误 V-5-1-90 mode:不能识别的操作模式 ◆◆ boot。 描述:将无效字符串指定为 -m 选项的参数。有效的字符串为:enable、disable 和 操作:提供正确的选项参数。 V-5-1-91 VxVM vxconfigd 警告 V-5-1-91 无法创建设备 device_path:reason ◆◆ root 文件系统用尽 inode 时才会发生。设备节点: 描述: vxconfigd 无法在 /dev/vx/dsk 或 /dev/vx/rdsk 下创建设备节点。仅当 操作:从 root 文件系统中删除一些不需要的文件。然后,使用以下命令重新生成该 # vxdctl enable V-5-1-92 VxVM vxconfigd 警告 V-5-1-92 无法执行 /usr/bin/rm 以删除目录:reason ◆ 的目录。这不是很严重的错误。目录不能删除的唯一副作用是该目录及其内容继续使用 root 文件系统中的空间。但是,这意味着没有装入 /usr 文件系统,或在某些系统上,rm 公用程序缺失或未在其通常的位置上。这对系统的常规运行可能是很严重的问题。 ◆ 描述:由于 /usr/bin/rm 公用程序不能通过 vxconfigd 执行,因此无法删除给定 未在 /usr/bin 目录中,请将其恢复。 操作:如果没有装入 /usr 文件系统,则需要确定如何装入。如果 rm 公用程序缺失或 V-5-1-111 VxVM vxconfigd 警告 V-5-1-111 无法派生以删除目录 directory:reason ◆ 这不是很严重的错误。目录不删除的唯一副作用是该目录及其内容将继续使用 root 文件系统中的空间。最有可能导致该错误的原因是系统没有足够的内存或分页空间以允许 vxconfigd 派生。 ◆ 描述:由于 vxconfigd 无法派生以便运行 rm 公用程序,因此无法删除给定的目录。 多的内存或分页空间。 操作:如果系统内存或分页空间如此少,则总体系统性能可能显著退化。建议添加更 46VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-116 VxVM vxconfigd 警告 V-5-1-116 无法打开日志文件 log_filename:reason ◆◆ 描述:由于给定的原因,无法打开 vxconfigd 控制台输出日志文件。 日志文件路径名。 操作:创建任何必需的目录,或按照第35页的“记录错误信息”中的说明使用不同的 V-5-1-117 VxVM vxconfigd 错误 V-5-1-117 无法启动 volume 卷,没有有效的 plex ◆ 故障导致所有 plex 不可用,便会发生该错误。使所有 plex 不可用的操作(例如,强制子磁盘分离或强制 plex 分离或脱机)也会导致发生该错误。 ◆ 描述:此错误表明该卷由于不包含任何有效的 plex 而无法重新启动。例如,如果磁盘 可能解决该问题。如果重新启动不能解决问题,唯一的办法就是修复这些 plex 所涉及到的磁盘,然后从备份中恢复文件系统。 操作:可能是因为驱动器未能旋转起来而导致该错误。如果是这样,进行重新启动有 V-5-1-121 VxVM vxconfigd 通知 V-5-1-121 已分离磁盘 disk ◆◆ 息,指出由于磁盘分离而导致其他记录分离。 描述:指定的磁盘看起来已变为不可用,并且已从其磁盘组中分离。可能出现附加信操作:如果启用了热重定位,受磁盘故障影响的 VERITAS Volume Manager 对象会得 到自动处理。系统将给 root 发送邮件,指出 VxVM 已采取的操作以及管理员应进一步采取的操作。 V-5-1-122 VxVM vxconfigd 警告 V-5-1-122 正在从卷 volume 中分离 plex plex ◆ 启动期间或者上次系统关机或崩溃之前发生的磁盘故障,或在上次系统关机或崩溃之前删除磁盘等都会导致 plex 分离。 ◆ 描述: 只有在系统启动时由 vxconfigd 自动启动的卷才会出现这种错误。I/O 故障, vxassist mirror 操作添加新镜像。还需考虑在运行此命令之前更换所有坏磁盘。 操作:要确保文件系统保持相同数目的活动镜像,请删除给定的 plex 并使用 第 5 章 错误信息 47 了解错误信息 V-5-1-123 VxVM vxconfigd 错误 V-5-1-123 磁盘组 group:因发生错误而禁用 ◆ 原因是过多的磁盘已发生故障,使 vxconfigd 不可能继续更新配置副本。此前应有一条错误信息指出遇到的具体错误。 如果已禁用的磁盘组是引导磁盘组,将显示下面的附加错误信息:VxVM vxconfigd 错误 V-5-1-104 所有事务处理均被禁用 描述:此信息表明某一错误情况已使 VxVM 不可能继续管理对磁盘组的更改。其主要 此附加信息表明 vxconfigd 已进入 disabled 状态,这样就不可能更改任何磁盘组(而不仅仅是引导磁盘组)的配置。 ◆ 操作:如果基础错误是由瞬态故障(如磁盘电缆错误)引起的,则重新启动即有可能 修复这种错误情况。否则,可能需要使用第33页的“恢复磁盘组配置”中提供的过程以及从备份中恢复的任何卷的内容来重新创建磁盘组配置。 V-5-1-124 VxVM vxconfigd 错误 V-5-1-124 磁盘组 group:更新失败:reason ◆ 有大量磁盘故障。在该错误之后一般会发生以下错误: 描述:I/O 故障导致 vxconfigd 无法更新磁盘组配置的任何活动副本。这通常意味着 VxVM vxconfigd 错误 V-5-1-123 磁盘组 group:因发生错误而禁用 ◆ 操作:如果基础错误是由瞬态故障(如磁盘电缆错误)引起的,则重新启动即有可能 修复这种错误情况。否则,可能必须重新创建磁盘组并从备份中恢复。 V-5-1-134 VxVM vxconfigd 错误 V-5-1-134 内存分配失败 ◆◆ 描述: 这暗示内存不足,无法启动 VxVM。 能在引导过程的早期发生,即在添加交换区之前发生,所以只增加交换空间可能没有用。 操作:除非系统内存量非常小,否则正常情况下不应发生此错误。因为此错误最有可 V-5-1-135 VxVM vxconfigd 致命错误 V-5-1-135 启动时内存分配失败 ◆◆ 描述: 这暗示内存不足,无法启动 VxVM。 能在引导过程的早期发生,即在添加交换区之前发生,所以增加交换空间可能没有用。 操作:除非系统内存量非常小,否则正常情况下不应发生此错误。因为此错误最有可 48VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-169 VxVM vxconfigd 错误 V-5-1-169 无法打开 /dev/vx/config:reason ◆ Volume Manager 内核驱动程序进行通信。最可能的原因是“设备已打开”。这表明某些进程(最可能是 vxconfigd已经将 /dev/vx/config 打开。可能性小一些的原因是“没有这样的文件或目录”或“没有这样的设备或地址”。对于上述任意一种情形,可能的原因包括: ◆◆◆ 描述:无法打开 /dev/vx/config 设备。vxconfigd 使用该设备与 VERITAS VERITAS Volume Manager 软件包安装没有正确完成。设备节点被管理员或错误的 shell 脚本文件删除。 vxconfigd: 操作:如果原因是“设备已打开”,则通过运行以下命令来停止或终止旧的 # vxdctl -k stop 对于其他故障原因,可考虑重新添加基本 VERITAS Volume Manager 软件包。这将重新配置设备节点并重新安装 VERITAS Volume Manager 内核设备驱动程序。有关如何添加软件包的信息,请参见《安装指南》。如果无法重新添加软件包,请与 VERITAS 技术支持部门联系以了解更多信息。 V-5-1-249 VxVM vxconfigd 通知 V-5-1-249 卷 volume 进入退化模式 ◆ 中时,RAID-5 卷的性能将极大地降低。更重要的是,其他子磁盘的故障可能会使 RAID-5 卷不可用。而且,如果 RAID-5 卷没有活动日志,则系统故障将使该卷不可用。 ◆ 描述:指定的 RAID-5 卷中子磁盘的分离导致该卷进入“退化”模式。当在退化模式 到自动处理。系统将给 root 发送邮件,指出 VxVM 已采取的操作以及管理员应进一步采取的操作。 操作:如果启用了热重定位,受磁盘故障影响的 VERITAS Volume Manager 对象会得 V-5-1-480 VxVM vxconfigd 错误 V-5-1-480 无法重置 VxVM 内核:reason ◆◆ 最常见的原因是“虚拟磁盘设备已打开”。这意味着 VxVM 跟踪或卷设备已打开。 描述:对 vxconfigd 指定了 -r reset 选项,但是无法重置 VxVM 内核驱动程序。操作:如果想要重置内核设备,需要跟踪并终止所有打开卷或 VERITAS Volume Manager 跟踪设备的进程。而且,如果所有的卷是作为文件系统装入的,还要卸载这些文件系统。 除非操作系统或 VxVM 中有缺陷,否则通常不会出现除“虚拟磁盘设备已打开”之外的任何出错原因。 第 5 章 错误信息 49 了解错误信息 V-5-1-484 VxVM vxconfigd 错误 V-5-1-484 无法启动 volume 卷,没有有效的完整 plex ◆ 盘故障导致所有 plex 不可用,便会发生该错误。使所有 plex 不可用的操作(例如,强制子磁盘分离或强制 plex 分离或脱机)也会导致发生该错误。 ◆ 描述:这些错误表明无法启动该卷,因为该卷不包含有效的完整 plex。例如,如果磁 可能解决该问题。如果重新启动不能解决问题,唯一的办法就是修复这些 plex 所涉及到的磁盘,然后从备份中恢复文件系统。 操作:可能是因为驱动器未能旋转起来而导致该错误。如果是这样,进行重新启动有 V-5-1-525 VxVM vxconfigd 通知 V-5-1-525 已分离卷 volume 的日志 ◆◆ 卷的 DRL 或 RAID-5 日志分离。出错的磁盘由“已分离磁盘”信息指出。dis 或 vxsd dis 删除出错日志。然后,使用 vxassist addlog(参见 vxassist(1M) 手册页)将新日志添加到卷。 描述:由于磁盘故障,或者由于管理员使用 vxdg -k rmdisk 删除了磁盘,导致指定操作:如果镜像了日志,则热重定位将尝试自动重定位出错的日志。使用 vxplex V-5-1-526 VxVM vxconfigd 通知 V-5-1-526 已分离卷 volume 中的 plex plex ◆◆ 描述:由于磁盘故障或管理员用 vxdg -k rmdisk 删除磁盘,导致禁用指定的 plex。 出错的磁盘由“已分离磁盘”信息指出。 到自动处理。系统将给 root 发送邮件,指出 VxVM 已采取的操作以及管理员应进一步采取的操作。 操作:如果启用了热重定位,受磁盘故障影响的 VERITAS Volume Manager 对象会得 V-5-1-527 VxVM vxconfigd 通知 V-5-1-527 已分离卷 volume 中的子磁盘 subdisk ◆◆ 描述:由于磁盘故障或管理员用 vxdg -k rmdisk 删除磁盘,导致禁用指定的子磁 盘。出错的磁盘由“已分离磁盘”信息指出。 到自动处理。系统将给 root 发送邮件,指出 VxVM 已采取的操作以及管理员应进一步采取的操作。 操作:如果启用了热重定位,受磁盘故障影响的 VERITAS Volume Manager 对象会得 50VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-528 VxVM vxconfigd 通知 V-5-1-528 已分离卷 volume ◆ 错的磁盘由“已分离磁盘”信息指出。除非磁盘故障是瞬态的并且可用重新启动修复,否则应将卷内容视为丢失。 ◆ 描述:由于磁盘故障或管理员用 vxdg -k rmdisk 删除磁盘,导致指定的卷分离。出 操作: 与 VERITAS 技术支持部门联系。 V-5-1-3 VxVM vxconfigd 错误 V-5-1-3 区别于已安装的 vxconfigd 版本 ◆ 程序。例如,如果升级 VxVM,然后未先重新启动即运行 vxconfigd,则会发生该错误。 ◆ 描述:在停止带有不匹配版本号的早期 vxconfigd 后启动了 vxconfigd 后台驻留 操作:重新启动系统。 V-5-1-4 VxVM vxconfigd 警告 V-5-1-4 磁盘 disk 在组 group 中标记为共享;跳过该磁盘 ◆◆ 描述:给定的磁盘被列为共享磁盘,但正在运行的 VxVM 版本不支持共享磁盘组。 该磁盘。如果确实要与其他系统共享该磁盘,则不要这么做。 操作:通常可忽略此信息。如果想在此系统上使用该磁盘,可使用 vxdiskadd 添加 V-5-1-5 VxVM vxconfigd 警告 V-5-1-5 组 group 中的磁盘 disk 被主机 hostid 锁定,跳过该磁盘 ◆◆ 机名相同)的主机锁定。 描述:给定的磁盘显示为被具有 VERITAS Volume Manager 主机 ID(通常与系统主操作:通常可忽略此信息。如果想在此系统上使用该磁盘,可使用 vxdiskadd 添加 该磁盘。如果确实要与其他系统共享该磁盘,则不要这么做。 第 5 章 错误信息 51 了解错误信息 V-5-1-6 VxVM vxconfigd 警告 V-5-1-6 组 group 中的磁盘 disk:未找到磁盘设备 ◆ 故障。(物理磁盘是通过匹配磁盘组配置记录中的磁盘 ID 和存储在物理磁盘上的 VERITAS Volume Manager 头文件中的磁盘 ID 来定位的。如果配置中的任何磁盘 ID 不能在任何物理磁盘的磁盘头中找到,则会显示此错误信息。这可能由瞬态故障(如电缆挂接不正确或磁盘旋转得不够快)所引起。另外,如果从系统中,或从由于磁头故障或电子故障而变为不可用的磁盘中物理地删除磁盘,也可能发生此问题。该磁盘上的任何 RAID-5 plex、DRL 日志 plex、 RAID-5 子磁盘或包含子磁盘的镜像 plex 均不可用。这样的磁盘故障(尤其是多磁盘故障)可能导致一个或多个卷变为不可用。 ◆ 描述:无法找到与给定磁盘组中指定的磁盘匹配的物理磁盘。这相当于那个磁盘发生 到自动处理。系统将给 root 发送邮件,指出 VxVM 已采取的操作以及管理员应进一步采取的操作。 操作:如果启用了热重定位,受磁盘故障影响的 VERITAS Volume Manager 对象会得 V-5-1-5 VxVM vxconfigd 警告 V-5-1-5 磁盘 disk 采用组 group 的名称,但组 ID 不同 ◆ 被导入。仅当两个磁盘组具有相同名称却有不同的磁盘组 ID 值时,才会发生此错误。在这种情况下,一个组将与它的所有磁盘一起导入,而另一个组则不导入。对于未选中的组中的磁盘将显示该信息。 ◆ 描述:在磁盘组导入过程中,发现了磁盘组名和磁盘组 ID 不匹配的磁盘。该磁盘无法 在此期间,磁盘的所有配置信息都会丢失。 操作:如果应将这些磁盘导入组中,则必须在稍后通过将磁盘添加到磁盘组来完成, V-5-1-557 VxVM vxconfigd 错误 V-5-1-557 磁盘 disk、组 group、设备 device:未用新主机 ID 更新错误:reason ◆ 该错误。此错误表明磁盘组中的某个磁盘无法用新的主机 ID 更新。这通常说明该磁盘已无法访问,或发生了其他故障。 ◆ 描述:使用 vxdctl hostid 更改系统的 VERITAS Volume Manager 主机 ID 会导致 操作:尝试运行以下命令,确定该磁盘是否仍可运行: # vxdisk check device 如果该磁盘不再是可运行的,则 vxdisk 应显示如下信息:device:错误:磁盘写入失败 52VERITAS Volume Manager 故障排除指南了解错误信息 这将导致该磁盘在其磁盘组中停止使用(如果该磁盘尚未停止使用)。如果该磁盘仍可运行(实际不应该是这样),则 vxdisk 将显示:device:正常 如果磁盘被列为“正常”,请重新尝试运行 vxdctl hostid。如果仍然导致错误,请与 VERITAS 技术支持部门联系。 V-5-1-568 VxVM vxconfigd 警告 V-5-1-568 磁盘组 group 被禁用,未用新主机 ID 更新磁盘 ◆ 描述:此故障的结果是,指定的磁盘组被禁用。之前的错误信息应该指出错误原因。 该信息表明未用新的 VERITAS Volume Manager 主机 ID 更新此磁盘组中的磁盘。只有执行 vxdctl hostid 操作时才会引发该警告信息。 ◆ 可能必须从头开始重构该磁盘组。如果由于瞬态错误(如电缆连接问题)而禁用了磁盘组,将来在重新启动时就可能因为系统的 VERITAS Volume Manager 主机 ID 发生变化而不会自动导入指定的磁盘组。这种情况下,可使用带 -C 选项的 vxdg import 直接导入该磁盘组。 操作:通常,除非磁盘组是因瞬态错误而被禁用,否则,没有办法修复禁用的磁盘组。 V-5-1-569 VxVM vxconfigd 错误 V-5-1-569 磁盘组 group、磁盘 disk:无法自动导入组:reason ◆ 关的信息在 reason 中给出。可能会显示附加的错误信息,其中提供了有关具体错误的更多信息。特别是,该信息之后常会出现如下信息: VxVM vxconfigd 错误 V-5-1-579 磁盘组 group:某些配置副本出错: 磁盘 device 副本 number:块 bno:error ... 描述:在系统启动时,vxconfigd 未能导入与指定磁盘关联的磁盘组。与具体故障相 自动导入失败的最常见原因是磁盘故障的数目过多,使 VxVM 不可能找到磁盘组配置数据库和内核更新日志的正确副本。磁盘组通常拥有足够的配置信息副本,使这种导入故障不太可能发生。 较严重的故障由类似下面的错误信息指示:配置记录不一致 磁盘组没有有效的配置副本配置中的记录重复配置副本中的格式错误无效块数无效幻数 第 5 章 错误信息 53 了解错误信息 这些错误表明所有配置副本已损坏(由于磁盘故障、应用程序或管理员对磁盘进行的写操作或 VxVM 中的缺陷)。某些可纠正的错误可能已由与自动导入失败信息一起出现的其他错误信息指出。请查找那些错误,了解有关出错原因的更多信息。 自动导入失败意味着那个磁盘组中的卷将不可用。如果那些卷上有文件系统,则系统可能由于不能在装入文件系统时访问卷而产生进一步的错误。 ◆ 组配置”中提供的过程重新创建磁盘组配置,并从备份中恢复所有卷的内容。可能有其他错误信息出现,它们会提供进一步的信息。请参见那些错误信息,了解有关如何继续操作的更多信息。如果那些错误信息没有明确说明如何继续操作,请与 VERITAS 技术支持部门联系。 操作:如果错误明显是由磁盘故障过多引起的,则可能必须使用第33页的“恢复磁盘 V-5-1-571 VxVM vxconfigd 错误 V-5-1-571 磁盘组 group、磁盘 disk:跳过具有重复名称的磁盘组 ◆ 名称及创建磁盘组时所分配的长的唯一标识符(磁盘组 ID)标识的。因此,此错误表明两个磁盘指出相同的磁盘组名,但是磁盘组 ID 不同。 如果创建磁盘组或从另一台机器导入磁盘组会导致与已经导入的磁盘组发生冲突,则 VxVM 不允许这样做。因此,在正常使用下该错误不会发生。但是,在以下两种情况下会发生此错误: ◆ 描述:具有相同名称的两个磁盘组被标记为由同一主机自动导入。磁盘组是通过简单 由于某些临时故障而无法自动导入磁盘组。如果创建了一个与出错的磁盘组同名的新磁盘组并进行重新启动,则新磁盘组将首先导入。旧磁盘组的自动导入将失败,因为最近修改的磁盘组具有高于旧磁盘组的优先级。 使用 -h 选项从一台主机逐出磁盘组,使该磁盘组在重新启动时从另一台主机自动导入。如果另一台主机已经自动导入了同名的磁盘组,则重新启动该主机会产生此错误。 ◆ ◆ 何使用 import 操作重命名磁盘组的信息,请参见 vxdg(1M) 手册页。 操作:如果要同时导入这两个磁盘组,那么请在导入时重命名第二个磁盘组。有关如 VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-577 VxVM vxconfigd 警告 V-5-1-577 磁盘组 group:磁盘组日志可能太小日志大小应至少为 number 个块 ◆ 盘组导入期间才会出现;在将新数据库对象添加到配置中时,磁盘无法访问,然后在使其可以访问且系统重新启动时,该信息才出现。通常不会在尚未显示有关数据库区大小的信息的情况下发生该错误。 ◆ 描述:对于组中当前配置的大小而言,磁盘组的日志区域已变得太小。该信息只在磁 上的数据。请参见 vxdisk(1M) 手册页。要重新初始化所有磁盘,必须将它们从关联的组中分离,重新初始化并重新添加。然后应逐出并重新导入磁盘组,以使对该组的日志区域的更改生效。 操作:以更大的日志区域重新初始化组中的磁盘。请注意,这要求从备份中恢复磁盘 V-5-1-579 VxVM vxconfigd 错误 V-5-1-579 磁盘组 group:某些配置副本出错:磁盘 disk、副本 number:[Block number]:reason ... ◆ 其他方面有错误,这些错误使那些副本不可用。此信息列出所有含有未纠正错误的配置副本,包括任何适当的逻辑块数。如果不显示其他原因,则该错误可能由磁盘组导入失败所引起。 ◆ 描述:在出错的磁盘组导入过程中,发现指定的磁盘组中的某些配置副本在格式上或 可成功地导入磁盘组。否则,可能必须恢复磁盘组配置。可以使用第33页的“恢复磁盘组配置”中提供的过程重新创建磁盘组配置 操作:如果由于瞬态错误(如电缆故障)导致某些副本失败,则重新启动或重新导入 V-5-1-583 VxVM vxconfigd 错误 V-5-1-583 磁盘组 group:重新导入磁盘组失败:reason ◆ 定磁盘组的导入。故障的原因已指出。可能显示附加错误信息,给出描述该问题的进一步信息。 ◆ 描述:在停止并重启动 vxconfigd 后(或禁用然后启用),VxVM 未能重新创建指 果问题是瞬态磁盘故障,则重新启动可解决这种错误情况。与错误相随的可能是诸如 “磁盘组没有有效的配置副本”之类的消息。这表明磁盘组配置副本已损坏(由于磁盘故障、应用程序或管理员对磁盘进行的写操作或 VxVM 中出现的缺陷)。可以使用第33页的“恢复磁盘组配置”中提供的过程重新创建磁盘组配置。 操作:这种失败的主要原因是在停止或禁用 vxconfigd 之前没有解决磁盘故障。如 第 5 章 错误信息 55 了解错误信息 V-5-1-587 VxVM vxdg 错误 V-5-1-587 磁盘组 groupname:导入失败:reason◆◆ 描述:磁盘组导入由于指定的原因而失败。操作:采取的操作取决于错误信息中给出的原因: 另一个主机正在使用磁盘 没有找到包含磁盘组的有效磁盘 第一条信息表明已将磁盘从以下系统中移走:崩溃的系统,或者在移动磁盘前检测不到磁盘组的系统。必须清除磁盘上存储的锁定。 第二条消息指出磁盘组不包含任何有效磁盘(而不是磁盘组不包含任何磁盘):由于磁盘配置副本中的主机 ID 与 /etc/vx/volboot 文件中存储的主机 ID 不匹配,可以将磁盘视为无效。 要清除特定设备集上的锁定,请使用以下命令: # vxdisk clearimport devicename ... 要在导入过程中清除锁定,请使用以下命令:# vxdg -C import diskgroup 警告对于具有双端口磁盘的系统,在使用 vxdisk clearimport 或 vxdg -C import 命令时请务必小心。清除锁定将允许同时从多个主机访问这些磁盘,因此可能导致数据损坏。如果在挂接到系统上的磁盘驱动器中找不到磁盘组的某些磁盘,import 操作就会失败。 找不到磁盘组的磁盘 磁盘组没有有效的配置副本 第一条信息表明这是一个可修复的错误。 第二条信息表明这是一个致命错误,它要求修复硬件或创建一个新的磁盘组,并修复磁盘组配置和数据: 如果磁盘组中的某些磁盘发生故障,可使用以下命令强制导入磁盘组: # vxdg -f import diskgroup 警告使用 -f 选项时请务必小心。它可能导致从不同的磁盘集两次导入同一磁盘组, 从而使磁盘组不一致。也可以使用 vxdiskadm 公用程序执行这些操作。要使用 vxdiskadm 逐出磁盘组,请选择菜单项 9(禁止访问(逐出)磁盘组)。要导入磁盘组,请选择菜单项 8(允许访问(导入)磁盘组)。vxdiskadm import 操作检查主机导入锁定,并提示您是否要清除找到的任何锁定。它还启动磁盘组中的卷。 56 VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-663 VxVM vxconfigd 警告 V-5-1-663 组 group:重复的虚拟设备编号: 卷 volume 从 major、minor 重映射至 major、minor ... ◆ 推荐使用的设备编号。如果两个磁盘组中的两个卷恰巧列出相同的设备编号,则其中的一个卷必须使用替代设备编号。这称为设备编号重映射。重映射是对卷的临时更改。如果逐出其他磁盘组且系统重新启动,则曾被重映射的卷可能不再重映射。而且,曾经重映射的卷不能保证在今后的重新启动中重映射到相同的设备编号。 ◆ 描述:指定的磁盘组的配置包含冲突的设备编号。磁盘组配置列出磁盘组中的每个卷 信息,请参见 vxdg(1M) 手册页。 操作:使用 vxdg reminor 命令对错误磁盘组中的所有卷进行永久重编号。有关更多 V-5-1-768 VxVM vxconfigd 通知 V-5-1-768 配置副本 number(在磁盘 disk 上)正在脱机:原因:reason ◆◆ 重问题,除非这是磁盘组中最后一个活动的配置副本。 描述:I/O 错误导致指示的配置副本被禁用。这只是一个通知,通常并不表示出现严操作:应考虑更换指示的磁盘,因为该错误意味着磁盘已损坏到了无法自动修复写错 误的地步。瞬态错误(如电缆或电源问题)也会导致该错误。 V-5-1-809 VxVM vxplex 错误 V-5-1-809 卷 volume 中的 Plex plex 被另一个公用程序锁定。 ◆ 命令应显示已设置了卷的临时和/或永久公用程序字段(TUTIL0 和 PUTIL0)及其一个 plex。 ◆ 描述:因为之前某一挂接 plex 的操作没有完成,所以 vxplex 命令失败。vxprint 该卷及其所有组件的 TUTIL0 和 PUTIL0 字段,这些字段是针对该卷及其所有组件设置的: # vxmend -g diskgroup clear all volume plex ... 操作:如果 vxtask list 命令没有显示为卷运行的任务,请使用 vxmend 命令来清除 V-5-1-923 VxVM vxplex 错误 V-5-1-923 记录 volume 在磁盘组 diskgroup1 中,而 plex 在磁盘组 diskgroup2 中。 ◆◆ 描述:试图快照合并来自其他磁盘组的 plex。操作:将快照卷移动到与原始卷相同的磁盘组中。 第 5 章 错误信息 57 了解错误信息 V-5-1-1171 VxVM vxconfigd 错误 V-5-1-1171 内核的版本号与 vxconfigd 不匹配 ◆ 配。导致该问题的唯一原因应是在升级了 VxVM 后,没有重新启动即运行 vxconfigd。 ◆ 描述:vxconfigd 的版本与 VERITAS Volume Manager 内核驱动程序的版本不匹 操作:重新启动系统。如果这不能解决问题,那么重新添加 VxVM 软件包。 V-5-1-15 VxVM vxconfigd 错误 V-5-1-15 启用失败:中止 ◆◆ 描述: vxconfigd 的常规启动失败。命令 vxdctl enable 也会导致此错误。操作: 此故障是致命的,并且 vxconfigd 被强制退出。最有可能的原因是操作系统 未能创建与其他公用程序间的内部处理通信通道。 VxVM vxconfigd 错误 V-5-1-15 启用失败:检查组配置副本时出错。未找到数据库文件 ◆ 描述: vxconfigd 的常规启动失败。命令 vxdctl enable 也会导致此错误。 目录 /var/vxvm/tempdb 无法访问。这可能是由于 root 文件系统已满或者 /var 是一个单独的文件系统(已损坏或未装入)而导致 root 文件系统损坏。 ◆ 操作: 如果 root 文件系统已满,请增加它的大小或删除一些文件,以便为 tempdb 文件留出空间。 如果 /var 是单独的文件系统,请确保它在 /etc/vfstab 中有相应的项。否则,寻找引导进程期间的 I/O 错误信息,这些信息指出硬件问题或用于 /var 文件系统的任何逻辑卷管理软件的错误配置。 VxVM vxconfigd 错误 V-5-1-15 启用失败:事务处理被禁用 ◆ 描述: vxconfigd 的常规启动失败。命令 vxdctl enable 也会导致此错误。 vxconfigd 正在继续运行,但是直到修复错误情况后才可能进行配置更新。另外,该信息之后可能会出现如下信息: VxVM vxconfigd 错误 V-5-1-579 磁盘组 group:某些配置副本 出错: 磁盘 device 副本 number:块 bno:error ... 可能显示其他错误信息,进一步指出基础问题。 58VERITAS Volume Manager 故障排除指南了解错误信息 ◆ 尝试重新运行命令。 操作: 分析这些错误信息,确定问题的潜在原因。执行错误信息所推荐的更改,然后 如果“某些配置副本出错”错误信息再次出现,可能表明问题实际出在磁盘组中的配置副本上。可以使用第33页的“恢复磁盘组配置”中提供的过程重新创建磁盘组配置。 V-5-1-2020 VxVM vxconfigd 错误 V-5-1-2020 无法终止现有的后台驻留程序,pid=process_ID ◆ 后台驻留程序进程。出于本文档说明的需要,此处的配置后台驻留程序进程指打开 /dev/vx/config 设备的任何进程(一次只能有一个进程可打开该设备)。如果存在一个已在运行的配置后台驻留程序进程,则使用 -k 选项会向该进程发送一个 SIGKILL 信号。如果在一定时间内,仍然有正在运行的配置后台驻留程序进程,则会显示上述错误信息。 ◆ 描述:指定了 -k (终止现有 vxconfigd 进程)选项,但无法终止正在运行的配置 他用户在 SIGKILL 信号后启动另一配置后台驻留程序进程都可导致上述错误。通过再次运行 vxconfigd -k 可检测是否为上述最后一种情况。如果错误信息重新出现,请与 VERITAS 技术支持部门联系。 操作:使配置后台驻留程序进程无法终止的内核错误、某种其他类型的内核错误或其 V-5-1-2197 VxVM vxconfigd 错误 V-5-1-2197 节点 N:丢失 vxconfigd ◆◆ 描述: vxconfigd 后台驻留程序没有在指示的集群节点上运行。操作:重新启动 vxconfigd 后台驻留程序。 V-5-1-2198 VxVM vxconfigd 错误 V-5-1-2198 节点 N:vxconfigd 未准备好 ◆◆ 描述:vxconfigd 后台驻留程序没有在集群中正确响应。 操作:在指示的节点上停止并重新启动 vxconfigd 后台驻留程序。 V-5-1-2290 VxVM vxdmpadm 错误 V-5-1-2290 试图启用一个不可用的控制器 ◆◆ 此信息。 描述:当尝试启用一个不工作或实际不存在的控制器时,vxdmpadm 公用程序将返回操作:检查硬件,确定是否存在该控制器且能否通过它执行 I/O 操作。 59 第 5 章 错误信息 了解错误信息 V-5-1-2353 VxVM vxconfigd 错误 V-5-1-2353 磁盘组 group:无法修复临时数据库:reason考虑使用“vxconfigd -x cleartempdir”[参见 vxconfigd(1M)]。 ◆ enable 禁用和启用它,则可能发生这种情况。此错误指示与读取文件 /var/vxvm/tempdb/group 相关的故障。这是一个用来存储修复早期 vxconfigd 状态时所需信息的临时文件。重新启动时会重新创建该文件,因此重新启动使该错误不复存在。 ◆ 描述:如果终止并重新启动 vxconfigd,或者使用 vxdctl disable 和 vxdctl 操作:如果可重新启动,请这样做。如果不想重新启动,则进行以下操作: a.确保没有正在运行的 vxvol、vxplex 或 vxsd 进程。 使用 ps -e 搜索这类进程,并使用 kill 来终止所找到的任何这类进程。有可能必 须运行 kill 两次才能终止这些进程。如果以这种方式中止公用程序,则难以在系统重新启动之前对某些卷进行管理更改。 b.使用以下命令,为所有导入的磁盘组重新创建临时数据库文件: # vxconfigd -x cleartempdir 2> /dev/console vxvol、vxplex 和 vxsd 命令利用这些 tempdb 文件交流锁定信息。如果文件被清除,则锁定信息将丢失。没有此锁定信息,两个公用程序对卷的配置所做的更改可能不兼容。 V-5-1-2524 VxVM vxconfigd 错误 V-5-1:2524 VOL_IO_DAEMON_SET 失败:形成集群时后台驻留程序计数必须大于 N◆◆ 需的最小数量。 描述:VERITAS Volume Manager 内核后台驻留程序 (vxiod) 的数量小于加入集群所操作:使用 vxiod 增加后台驻留程序的数量。 V-5-1-2630 VxVM vxconfigd 警告 V-5-1-2630 库和 vxconfigd 在客户机 number 存在与否的问题上不一致 ◆◆ 描述:可以放心忽略此警告。操作:不需要采取任何操作。 60VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-2824 VxVM vxconfigd 错误 V-5-1-2824 配置后台驻留程序错误 242 ◆◆ 动重新尝试加入。 描述:节点无法加入集群,或者加入集群所需时间太长。如果加入失败,该节点会自操作:如果加入过程缓慢或重试最终成功,则不必采取任何操作。 V-5-1-2829 VxVM vxdg 错误 V-5-1-2829 diskgroup:磁盘组版本不支持的功能;请参见 vxdg upgrade 命令 ◆◆ 描述:指定磁盘组的版本不支持磁盘组移动、分割或结合操作。操作:使用 vxdg upgrade diskgroup 命令更新磁盘组版本。 V-5-1-2830 VxVM vxconfigd 错误 V-5-1-2830 磁盘被其他主机保留 ◆◆ 描述:试图使一个磁盘联机,而该磁盘的控制器已由集群中的另一主机保留。 VxVM 将使其联机。 操作:没有必要采取操作。集群管理器将释放该磁盘,并且当该节点加入集群时 V-5-1-2841 VxVM vxconfigd 错误 V-5-1-2841 启用失败:磁盘组配置副本出错。配置更新中发生意外的内核错误;事务处理被禁止。 ◆◆ 描述:通常意味着多径处理的配置不正确。 操作:有关可能的原因和解决方法,请参见第71页的“V-5-1-5929”。 V-5-1-2860 VxVM vxdg 错误 V-5-1-2860 事务处理已在进行中 ◆◆ 组移动、分割或结合操作使用(可能是由于对系统故障进行修复导致的)。 描述:磁盘组移动、分割或结合操作中指定的一个磁盘组当前正被另一不相关的磁盘操作:使用 vxprint 命令显示所涉及的磁盘组的状态。如果 vxprint 显示磁盘组的 TUTIL0 字段设置为 MOVE,而且您确信没有正在进行的磁盘组移动、分割或结合操作,请按照第16页的“从未完成的磁盘组移动中修复”中的说明,使用 vxdg 命令来清除该字段。否则,重试操作。 第 5 章 错误信息 61 了解错误信息 V-5-1-2862 VxVM vxdg 错误 V-5-1-2862 object:不支持操作 ◆◆ VVR 对象不能在磁盘组间移动。 描述:DCO 和 snap 对象被 Persistent FastResync(保留式快速重同步)分离,而 操作:无。不支持此操作。 V-5-1-2866 VxVM vxdg 错误 V-5-1-2866 object:记录已存在于磁盘组中 ◆◆ 操作失败。这种名称冲突最有可能发生于 snap 对象和快照 plex。 描述:因为一个磁盘组中的某个对象与另一个磁盘组中的对象同名,因此磁盘组结合操作:使用以下命令更改其中一个磁盘组中的对象名称: # vxedit -g diskgroup rename old_name new_name 有关使用 vxedit 命令的更多信息,请参见 vxedit(1M) 手册页。 V-5-1-2870 VxVM vxdg 错误 V-5-1-2870 volume:卷或 plex 设备已打开或已装入 ◆◆ 描述:试图在包含打开的卷的磁盘组上执行磁盘组移动、分割或结合操作。 中的卷的应用程序,并卸载任何配置在卷中的文件系统。 操作:很可能是配置在卷上的文件系统仍处于装入状态。停止那些访问配置在磁盘组 V-5-1-2879 VxVM vxdg 错误 V-5-1-2879 subdisk:记录已关联 ◆◆ 描述:指定的子磁盘不是顶层对象。 操作:磁盘组移动、分割或结合操作的指定对象必须是磁盘或顶层卷。 V-5-1-2907 VxVM vxdg 错误 V-5-1-2907 diskgroup:磁盘组不存在 ◆◆ 描述:磁盘组不存在或未导入 操作:使用正确的名称,或导入磁盘组,然后重试。 62VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-2908 VxVM vxdg 错误 V-5-1-2908 diskdevice:请求越过了磁盘组界限 ◆◆ 描述:未在源磁盘组中配置用于磁盘组移动或分割操作的指定磁盘设备。操作:纠正磁盘组移动或分割操作中指定的磁盘对象的名称。 V-5-1-2911 VxVM vxdg 错误 V-5-1-2911 diskname:磁盘不可用 ◆◆ 描述:指定的磁盘已不可用。 磁盘。 操作:在更换或修复该磁盘前,不要在任何磁盘组移动、分割或结合操作中包括该 V-5-1-2922 VxVM vxconfigd 错误 V-5-1-2922 磁盘组存在且已导入 ◆◆ 磁盘组。 描述:一个从属节点尝试加入集群,但集群中已存在一个与其专用磁盘组同名的共享操作:使用 vxdg -n newname import diskgroup 操作重命名主节点上的共享磁盘 组或从属节点上的专用磁盘组。 V-5-1-2928 VxVM vxdg 错误 V-5-1-2928 diskgroup:配置副本的配置太大 ◆◆ 描述:磁盘组的配置数据库太小,无法容纳磁盘组移动或结合操作后扩展的配置。操作:无。 V-5-1-2933 VxVM vxdg 错误 V-5-1-2933 diskgroup:无法删除最后一个磁盘组配置副本 ◆◆ 描述:所请求的磁盘组移动、分割或结合操作将使磁盘组没有任何配置副本。操作:无。不支持此操作。 第 5 章 错误信息 63 了解错误信息 V-5-1-2935 VxVM vxassist 错误 V-5-1-2935 磁盘组配置中没有更多的空间。 ◆◆ 描述: 对于 VxVM 对象记录,存在磁盘组配置中没有更多的空间的配置数据库。 或者使用磁盘组分割/结合功能把这些卷移到其他磁盘组中。为了避免将来出现问题,不得在一个磁盘组内创建数百个以上的卷;或者在将磁盘添加到新的磁盘组时指定更大的大小。 操作:把几个卷的内容复制到其他磁盘组中,然后再将这些卷从该磁盘组上删除掉; V-5-1-3009 VxVM vxdg 错误 V-5-1-3009 object:名称与导入的磁盘组冲突 ◆◆ 描述:分割操作的目标磁盘组已作为导入磁盘组存在。操作:为目标磁盘组另选一个名称。 V-5-1-3020 VxVM vxconfigd 错误 V-5-1-3020 集群处理中出错 ◆◆ 描述:这可能是由与当前集群状态不一致的操作而导致的(如试图将共享磁盘组导入 或逐出从属节点)。也可能是由来自 vxclust 的意外命令序列所引起的。 操作:从主节点执行该操作。 V-5-1-3022 VxVM vxconfigd 错误 V-5-1-3022 无法在从属节点上找到磁盘 ◆ 描述:集群中的从属节点无法找到共享磁盘。此信息伴随以下 syslog 信息出现: VxVM vxconfigd 错误 V-5-1-2173 无法找到磁盘 disk ◆ 点和从属节点上的磁盘,并确保带 shared 标志的同一磁盘集对两个节点都是可见的。如果不是,则检查与磁盘的连接。 操作:确保同一组共享磁盘在两个节点上都是联机的。用 vxdisk list 命令检查主节 V-5-1-3023 VxVM vxconfigd 错误 V-5-1-3023 磁盘正被另一集群使用 ◆◆ 描述:尝试导入磁盘组,该磁盘组的磁盘是用另一集群的 ID 标记的。 操作:如果该磁盘组未被另一集群导入,请使用 -C(清除导入)标志重试导入。 VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-3024 VxVM vxconfigd 错误 V-5-1-3024 vxclust 不在那里 ◆◆ vxclust 故障可能会导致该错误。 描述:尝试加入集群期间的错误导致 vxclust 失败。加入期间另一节点的故障或 操作:重试加入。另一节点上的错误信息可能会阐明此问题。 V-5-1-3025 VxVM vxconfigd 错误 V-5-1-3025 无法为集群添加入口 ◆◆ 描述: vxconfigd 不能创建与其他节点上的 vxconfigd 进行通信的入口。缺乏系统 资源(如内存或文件描述符)的退化系统中可能会发生该错误。 操作:如果系统看起来没有退化,请停止并重新启动 vxconfigd,然后重试。 V-5-1-3030 VxVM vxconfigd 错误 V-5-1-3030 卷修复在进行中 ◆◆ 描述:崩溃节点在其 DRL 映射合并到修复映射中之前试图重新加入集群。操作:合并操作完成后重试加入。 V-5-1-3031 VxVM vxconfigd 错误 V-5-1-3031 无法分配次要 minor ◆ 的次要编号。 描述:从属节点试图加入集群,但从属节点上的现有卷与主节点上的共享卷具有相同 与此信息同时显示的还有以下控制台信息: VxVM vxconfigd 错误 V-5-1-2192 次要编号 minor 磁盘组 group 正在使用中 ◆ 节点上的磁盘组或从属节点上的冲突磁盘组选择一个新的次要编号范围。如果磁盘组中有打开的卷,则在逐出并更新(显式地或通过重新启动系统)该磁盘组之前,reminor 操作将无效。 操作:在重新尝试加入前,请使用 vxdg reminor(请参见 vxdg(1M) 手册页)为主 第 5 章 错误信息 65 了解错误信息 V-5-1-3032 VxVM vxconfigd 错误 V-5-1-3032 主节点没有发送数据 ◆◆ VxVM 错误时才可能看到此信息。 描述:在从属节点加入协议过程中,从主节点接收到无数据的信息。只有出现内部 操作: 与 VERITAS 技术支持部门联系。 V-5-1-3033 VxVM vxconfigd 错误 V-5-1-3033 加入在进行中 ◆◆ 描述:在集群重配置期间试图导入或逐出共享磁盘组。 操作:在集群重配置完成后重试。 V-5-1-3034 VxVM vxconfigd 错误 V-5-1-3034 当前不允许加入 ◆◆ 描述:从属节点试图在主节点还未准备好时加入集群。从属节点将自动重试。 视器。 操作:如果最后完成加入,则没有必要采取操作。否则,请查看主节点上的集群监 V-5-1-3042 VxVM vxconfigd 错误 V-5-1-3042 集群许可证操作 ◆◆ 描述:试图进行需要完全集群许可证的操作,但尚无这样的许可证可用。 数 plex,只剩其中的一个 plex。如果在事务处理期间发生此错误,则在除主节点之外的所有节点上停用该磁盘组。 操作:如果在激活磁盘组时发生此错误,则在激活磁盘组之前,从镜像卷中分离大多 V-5-1-3046 VxVM vxconfigd 错误 V-5-1-3046 节点激活冲突 ◆◆ 盘组。 描述:由于磁盘组已在集群中的另一个节点上以冲突模式激活,因此无法激活该磁操作:稍后重试,或停用冲突节点上的磁盘组。 66VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-3049 VxVM vxconfigd 错误 V-5-1-3049 重试滚动升级 ◆◆ 描述:当事务处理正在进行时试图将集群升级到更高的协议版本。操作:稍后重试升级。 V-5-1-3050 VxVM vxconfigd 错误 V-5-1-3050 至少超出一个节点的版本范围 ◆◆ 描述:尝试通过运行 vxdctl upgrade 升级集群之前,所有节点都应能够支持新协议 版本。如果至少一个节点不支持新协议版本,则升级会失败。上,然后重试升级。 操作:确保将支持新协议版本的 VERITAS Volume Manager 软件包安装在所有节点 V-5-1-3091 VxVM vxdg 错误 V-5-1-3091 diskname:磁盘未移动,但该磁盘上的子磁盘已移动 ◆◆ 描述:某些卷拥有这样的子磁盘,这些子磁盘不在所提供的对象列表列出的磁盘上。操作:对 vxdg listmove 使用 -o expand 选项,以便生成一个自包含的对象列表。 V-5-1-3212 VxVM vxconfigd 错误 V-5-1-3212 DRL 日志大小不足:日志记录被禁用。 ◆◆ 描述:成功地启动了 DRL 日志大小不足的卷,但 DRL 日志记录是禁用的并且执行了 完全修复。 操作:创建具有足够大小的新 DRL。 V-5-1-3243 VxVM vxdmpadm 错误 V-5-1-3243 VxVM 恢复后台驻留程序已在运行。为了更改其参数,可以停止并采用所需的参数重新启动此恢复后台驻留程序。 ◆◆ 执行。 描述:在此恢复后台驻留程序运行的同时,vxdmpadm start restore 命令已经操作:停止恢复后台驻留程序,然后用 vxdmpadm(1M) 手册页中所示的必需参数集 重新启动恢复后台驻留程序。 第 5 章 错误信息 67 了解错误信息 V-5-1-3362 VxVM vxdmpadm 错误 V-5-1-3362 试图禁用控制器失败。一个(或多个)设备只能通过此控制器访问。如果仍要禁用此控制器,请使用 -f 选项。 ◆◆ 描述:禁用控制器会导致某些设备不可访问。 操作:要禁用连接到磁盘的唯一路径,请使用 -f 选项。 V-5-1-3486 VxVM vxconfigd 错误 V-5-1-3486 不在集群中 ◆◆ version)是否不起作用。 描述:如果节点不在集群中,应检查当前协议版本(使用 vxdctl protocol 操作:将节点添加到集群中并重试。 V-5-1-36 VxVM vxassist 错误 V-5-1-36 在配置中未找到卷记录 ID rid。 ◆ 卷移动到新磁盘组而导致卷记录标识符 (rid) 更改时,会发生此问题。因为原始卷的记录标识符已更改,所以快照卷无法识别它。 ◆ 描述:在使用 snapback 重新挂接快照卷时检测到错误。当因磁盘组分割操作将原始 操作:使用以下命令执行快照合并: # vxplex [-g diskgroup] -f snapback volume plex V-5-1-3828 VxVM vxconfigd 错误 V-5-1-3828 升级操作失败:已在最高版本 ◆◆ 描述:升级操作失败,这是因为集群已运行在主节点所支持的最高协议版本上。操作:由于主节点已运行在它能够支持的最高版本上,因此不需要采取进一步操作。 V-5-1-3848 VxVM vxconfigd 错误 V-5-1-3848 volboot 文件中存在不正确的协议版本 (number) ◆ volboot 文件损坏的集群。在尝试将节点加到集群之前,volboot 文件应始终包含所支持的协议版本。 ◆ 描述:用户可能通过手动编辑,尝试将一个节点加入一个 VxVM 软件被错误升级或 加到集群之前,volboot 文件应始终包含所支持的协议版本。运行 vxdctl init 以将有效的协议版本写入 volboot 文件。重新启动 vxconfigd 并重试加入。 操作: 使用 vxdctl protocolversion 命令来检验支持的集群协议。在尝试将节点 68VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-4220 VxVM vxconfigd 错误 V-5-1-4220 DG 移动:无法导入磁盘组,正在放弃 ◆◆ 描述:在磁盘组移动操作期间,无法导入指定的磁盘组(从可导入的磁盘组获得磁盘 组 ID。) 用 vxdg recover 命令。对一个磁盘组指定 -o clean 选项,而对另一个磁盘组指定 -o remove 选项。有关更多信息,请参见第16页的“从未完成的磁盘组移动中修复”。 操作:该磁盘组可能已移到另一主机。一种选择是定位它,并对源和目标磁盘组使 V-5-1-4267 VxVM vxassist 警告 V-5-1-4267 卷 volume 已经具有至少一个快照 plex用这些 plex 创建的快照卷将有一个不带关联的 dco plex 的 dco 卷。 ◆ 描述:在将 DCO 对象和 DCO 卷添加至镜像卷时检测到错误。该卷上至少有一个已创 建的快照 plex。因为此快照 plex 是在卷没有关联的 DCO 时创建的,所以没有为它分配 DCO plex。 ◆ 操作: 选择《VERITAS Volume Manager 管理员指南》中“管理卷快照”一章的“添 加版本 0 的 DCO 与 DCO 卷”一节。 V-5-1-4277 VxVM vxconfigd 错误 V-5-1-4277 cluster_establish:CVM 协议版本超出范围 ◆ 果集群运行在不同的协议版本下,则主节点拒绝其加入并将当前协议版本发送到从属节点。从属节点用当前版本重试(如果加入节点支持该版本),否则加入失败。 ◆ 描述:节点加入集群时,它将尝试以存储在其 volboot 文件中的协议版本加入。如 版本。 操作:确保加入节点安装了支持当前集群协议版本的 VERITAS Volume Manager V-5-1-4551 VxVM vxconfigd 错误 V-5-1-4551 dg_move_recover:无法定位磁盘,正在放弃 ◆◆ 描述:无法找到磁盘组移动操作中涉及的磁盘,且其中一个指定磁盘组无法导入。 息,请参见第16页的“从未完成的磁盘组移动中修复” 。 操作:可能需要手动使用 vxdg recover 命令来清理要导入的磁盘组。有关更多信 第 5 章 错误信息 69 了解错误信息 V-5-1-4620 VxVM vxassist 警告 V-5-1-4620 从 SAL 检索信息时出错 ◆◆ SAL 的输出中检测到错误。 描述:vxassist 命令无法识别正在使用的 SAN Access Layer (SAL) 的版本,或在 操作:如果需要连接到 SAL,应确保安装了正确的 SAL 版本并进行了正确配置。否 则,应将下面一行添加到 vxassist 默认值文件(通常是 /etc/default/vxassist)中,以防在 vxassist 和 SAL 之间发生通信:salcontact=no V-5-1-4625 VxVM vxassist 警告 V-5-1-4625 SAL 身份验证失败... ◆◆ 描述:SAN Access Layer (SAL) 拒绝了 vxassist 命令提供的凭据。 则,应将下面一行添加到 vxassist 默认值文件(通常是 /etc/default/vxassist)中,以防在 vxassist 和 SAL 之间发生通信:salcontact=no 操作:如果需要连接到 SAL,请使用 vxspcshow 命令设置有效的用户名和密码。否 V-5-1-5150 VxVM vxassist 错误 V-5-1-5150 snapshot_volume 中活动快照镜像的数量不足。 ◆◆ 描述:将指定数量的快照镜像快照合并回原始卷的尝试失败。操作:指定的快照镜像数要小于或等于快照卷中的数目。 V-5-1-5160 VxVM vxplex 错误 V-5-1-5160 Plex plex 没有与快照卷关联。 ◆◆ 描述:试图对一个不是来自快照卷的 plex 进行快照合并。操作:指定一个来自快照卷的 plex。 V-5-1-5161 VxVM vxplex 错误 V-5-1-5161 Plex plex 未挂接。 ◆◆ 描述:试图对已分离的 plex 进行快照合并。操作:将快照 plex 重新挂接到快照卷。 70VERITAS Volume Manager 故障排除指南了解错误信息 V-5-1-5162 VxVM vxplex 错误 V-5-1-5162 Plex 不属于同一快照卷。 ◆◆ 描述:试图对属于其他快照卷的 plex 进行快照合并。操作:在单独的 vxplex snapback 调用中指定 plex。 V-5-1-5929 VxVM vxconfigd 通知 V-5-1-5929 无法解决磁盘 ID 重复问题。 ◆ 试(使用特定于阵列的逻辑)选择适当的磁盘。如果无法选择磁盘,那么 VxVM 不会向磁盘组中导入任何重复磁盘。在 VxVM 无法做出选择的情况(极少数)下,必须手动选择要使用的重复磁盘。 注意默认的行为或VxVM是避免选择错误的磁盘,因为这会导致数据损坏。具有硬 件镜像能力的阵列尤其容易受到这种数据损坏的影响。 ◆ 描述: 当 VxVM 检测到具有重复磁盘 ID(唯一内部标识符)的磁盘时,VxVM 会尝 操作:下列情况中需要用户干预: ◆ 第一种情况:对有多条路径的阵列禁用了 DMP 后,该阵列的每条路径都被归为唯 一磁盘类别。 如果 DMP 被隐藏,VxVM 将不知道选择哪条路径作为实际路径。必须手动选择要使用的路径。确定要排除的路径,然后编辑文件 /etc/vx/vxvm.exclude,或者(如果 vxconfigd 正在运行)从 vxdiskadm 选项 17(防止多径处理/对 VxVM 隐藏设备)中选择第 1 项(对 VxVM 隐藏通过控制器的所有路径)或第 2 项(对 VxVM 隐藏路径)。以下示例显示了一个 vxvm.exclude 文件,其中的路径 c6t0d0s2、c6t0d1s2 和 c6t0d2s2 被从 VxVM 中排除: exclude_all 0paths c6t0d0s2 /pci@1f,4000/SUNW,ifp@2/ssd@w50060e8003275705,0c6t0d1s2 /pci@1f,4000/SUNW,ifp@2/ssd@w50060e8003275705,1c6t0d2s2 /pci@1f,4000/SUNW,ifp@2/ssd@w50060e8003275705,2# controllers# product# pathgroups 第 5 章 错误信息 71 了解错误信息 ◆ 第二种情况:某些阵列(如 EMC 和 HDS)提供硬件镜像。当 LUN 对被分割时,根据执行过程的不同,可能会得到两个具有相同磁盘 ID 的磁盘。 请与阵列供应商核实,确保所使用的分割过程是正确的。如果您知道要使用哪个 LUN,请选择要排除的路径,然后要么编辑文件 /etc/vx/vxvm.exclude,要么(如果 vxconfigd 正在运行)从 vxdiskadm 选项 17(防止多径处理/对 VxVM 隐藏设备)中选择第 1 项(对 VxVM 隐藏通过控制器的所有路径)或第 2 项(对 VxVM 隐藏路径)。 ◆ 第三种情况:如果由于使用了 dd 命令或任何其他磁盘复制公用程序而导致磁盘重复,请选择要排除的重复磁盘集,然后要么编辑文件 /etc/vx/vxvm.exclude,要么(如果 vxconfigd 正在运行)从 vxdiskadm 选项 17(防止多径处理/对 VxVM 隐藏设备)中选择第 1 项(对 VxVM 隐藏通过控制器的所有路径)或第 2 项(对 VxVM 隐藏路径)。 V-5-2-2400 VxVM vxdisksetup 通知 V-5-2-2400 daname:此设备的 DA 记录重复。 ◆ 用 luxadm 命令通知操作系统,则可能会出现此错误。vxdisk list 命令的输出中将出现类似以下内容的重复磁盘访问记录条目: c1t5d0s2 sliced c1t5d0s2 - error c1t5d0s2 sliced c1t5d0s2 - online|error 描述: 如果在 Sun StorEdgeTM A5x00(或类似型号)阵列中更换了一个磁盘,而未使 注意第二个条目的状态可以是 online 或 error。 ◆ 操作:执行下列步骤解决此问题: a.对每个重复的磁盘访问名称使用以下命令,使其全部脱离 VxVM 的控制: # vxdisk rm daname 运行 vxdisk list 命令,以确保删除与该磁盘访问名称对应的所有条目。b.使用 Solaris luxadm 命令获取该磁盘的 A5K 阵列名称和插槽号,然后使用 luxadm 和获得的信息删除该磁盘: # luxadm disp /dev/rdsk/daname# luxadm remove_device array_name,slot_numberc.按照 luxadm 的说明取出该磁盘。 72VERITAS Volume Manager 故障排除指南了解错误信息 d.运行以下命令: # devfsadm -C# vxdctl enable 这将删除与该物理磁盘对应的设备项。 e.按照步骤 a 中的说明运行 vxdisk list 和 vxdisk rm 命令,列出与该磁盘访问 名称对应的所有剩余条目,并使其脱离 VxVM 控制。f. 对该磁盘的所有路径使用以下 luxadm 命令以使磁盘脱机。以下示例说明如何使连接到控制器 c1 和 c2 的磁盘脱机: # luxadm -e offline /dev/dsk/c1t5d0s2# luxadm -e offline /dev/dsk/c2t5d0s2 g.重复步骤 e和步骤 f,直到 vxdisk list 的输出中不再显示与该磁盘对应的条目。 至此,从 VxVM 中删除该磁盘的失效设备项的工作就完成了。h.最后,请按照《VERITAS Volume Manager 管理员指南》的“管理磁盘”一章中 有关更换出错的磁盘或已删除磁盘的说明操作。 第 5 章 错误信息 73 了解错误信息 74VERITAS Volume Manager 故障排除指南索引 .cmdlog 文件 25.translog 文件 27 /etc/vx/cbr/bk/diskgroup.dgid dgid .binconfig 文件 32dgid .cfgrec 文件 32dgid .diskinfo 文件 32dgid.dginfo 文件 32 /etc/vx/log 日志记录目录 25, 27/var/adm/configd.log 文件 35 /var/adm/syslog/syslog.log 文件 36字母 ACTIVE plex 状态 3ACTIVE 卷状态 11BADLOG plex 状态 10badlog 标志 DCO 清除 18CLEAN plex 状态 3cmdlog 文件 25DCO 恢复卷 16 删除 badlog 标志 18DCO 卷 从 I/O 故障中修复 24DEGRADED 卷状态 9 DETACHED 卷内核状态 10DISABLED plex 内核状态 3, 10DMP 修复重复磁盘 ID 71EMPTY plex 状态 3 ENABLED plex 内核状态 3ENABLED 卷内核状态 11IOFAIL plex 状态 4LOG plex 状态 10MOVE 标志 设置于 TUTIL0 字段中 16NEEDSYNC 卷状态 12parity 重建检查点设置 12 对 RAID-5 的重同步 11失效 8plex 处于 RECOVER 状态 5显示状态 2修复镜像卷 5已定义 3映射问题 14plex 内核状态 DISABLED 3, 10ENABLED 3plex 状态 ACTIVE 3BADLOG 10CLEAN 3EMPTY 3IOFAIL 4LOG 10STALE 5RAID-5 不可启动的卷 14分离子磁盘 9故障 8恢复卷 11 奇偶校验重同步 11启动卷 13 启动修复过程 10强制启动 15热重定位 11 日志 plex 的重要性 9失效的奇偶校验 8修复过程 10 修复日志 plex 12修复失效子磁盘 13子磁盘移动修复 13RECOVER 状态 5REPLAY 卷状态 10SYNC 卷状态 10, 12 75 syslog 错误日志文件 36translog 文件 27TUTIL0 字段 清除 MOVE 标志 16V-5-0-106 40V-5-0-108 40V-5-0-110 40V-5-0-111 40V-5-0-112 41V-5-0-144 41V-5-0-145 41V-5-0-146 41V-5-0-147 42V-5-0-148 42V-5-0-1 42V-5-0-166 42V-5-0-168 43V-5-0-181 43V-5-0-194 43V-5-0-196 43V-5-0-2 38V-5-0-207 43V-5-0-216 44V-5-0-237 44V-5-0-243 44V-5-0-244 44V-5-0-249 44V-5-0-251 45V-5-0-252 45V-5-0-258 45V-5-0-34 39V-5-0-35 39V-5-0-386 45V-5-0-4 39V-5-0-55 39V-5-0- 40V-5-1-111 46V-5-1-116 47V-5-1-117 47V-5-1-1171 58V-5-1-121 47V-5-1-122 47V-5-1-123 31, 48V-5-1-1236 14V-5-1-1237 14V-5-1-124 48V-5-1-134 48V-5-1-135 48 76 V-5-1-15 58V-5-1-169 49V-5-1-2020 59V-5-1-2173 V-5-1-2192 65V-5-1-2197 59V-5-1-2198 59V-5-1-2290 59V-5-1-2353 60V-5-1-249 49V-5-1-2524 60V-5-1-2630 60V-5-1-2824 61V-5-1-2829 61V-5-1-2830 61V-5-1-2841 61V-5-1-2860 61V-5-1-2862 62V-5-1-2866 62V-5-1-2870 62V-5-1-2879 62V-5-1-2907 16, 62V-5-1-2908 63V-5-1-2911 63V-5-1-2922 63V-5-1-2928 63V-5-1-2933 63V-5-1-2935 V-5-1-3009 V-5-1-3020 V-5-1-3022 V-5-1-3023 V-5-1-3024 65V-5-1-3025 65V-5-1-3030 65V-5-1-3031 65V-5-1-3032 66V-5-1-3033 66V-5-1-3034 66V-5-1-3042 66V-5-1-3046 66V-5-1-3049 67V-5-1-3050 67V-5-1-3091 67V-5-1-3212 67V-5-1-3243 67V-5-1-3362 68V-5-1-3486 68V-5-1-36 68 VERITAS Volume Manager 故障排除指南V-5-1-3828 68V-5-1-3848 68V-5-1-4220 69V-5-1-4267 69V-5-1-4277 69V-5-1-4551 69V-5-1-4620 70V-5-1-4625 70V-5-1-480 49V-5-1-484 50V-5-1-5150 70V-5-1-5160 70V-5-1-5161 70V-5-1-5162 71V-5-1-525 50V-5-1-526 50V-5-1-527 50V-5-1-528 51V-5-1-3 51V-5-1-4 51V-5-1-5 51V-5-1-6 52V-5-1-5 52V-5-1-557 52V-5-1-568 53V-5-1-569 31, 53V-5-1-571 V-5-1-577 55V-5-1-579 55, 58V-5-1-583 55V-5-1-587 56V-5-1-5929 71V-5-1-6012 34V-5-1-663 57V-5-1-6840 24V-5-1-768 57V-5-1-90 46V-5-1-91 46V-5-1-92 46V-5-1-923 57V-5-2-2400 72vxcmdlog 控制命令日志 25vxconfigbackup 备份磁盘组配置 32vxconfigd 日志文件 35 vxconfigd.log 文件 35vxconfigrestore 索引 恢复磁盘组配置 33vxdco 从 DCO 中删除 badlog 标志 18vxdg 从出错的磁盘组的移动、分割或结合中修复 16vxedit 清除磁盘出错标志 6vxinfo 命令 2vxmend 命令 5vxplex 命令 12vxprint 显示卷和 plex 状态 2vxreattach 重新挂接出错的磁盘 7vxsnap make 从故障中修复 22vxsnap prepare 从故障中修复 21vxsnap reattach 从故障中修复 23vxsnap refresh 从故障中修复 23vxsnap restore 从故障中修复 23vxtranslog 控制事务日志记录 27VxVM RAID-5 修复过程 10vxvol recover 命令 13vxvol resync 命令 12vxvol start 命令 5C 重构读取模式,失效的子磁盘 9重同步 RAID-5 奇偶校验 11重新挂接磁盘 7重新启动禁用的卷 6出错标志 清除 6磁盘 重新挂接 7出错标志 6故障 9 故障原因 1修复重复 ID 71重新挂接出错的 7磁盘 ID 77 修复重复 71磁盘组 备份配置 31, 32 从失败的移动、分割或结合中修复 16恢复配置 31, 33解决备份冲突 34配置备份文件 32磁盘组错误 新主机 ID 52错误信息 37 CVM 协议版本超出范围 69 DRL 日志大小不足,日志记录被禁用 67Plex plex 没有与快照卷关联 70Plex plex 未挂接 70 Plex 不属于同一个快照卷 71RAID-5 plex 未映射整个卷长 14 snapshot_volume 中的活动快照镜像数不足 70 volboot 文件中存在不正确的协议版本 68vxclust 不在那里 65 vxconfigd 次要编号正在使用中 65vxconfigd 未准备好 59 VxVM 恢复后台驻留程序已在运行 67不能识别的操作模式 46不在集群中 68不支持操作 62重试滚动升级 67 重新导入磁盘组失败 55磁盘被其他主机保留 61磁盘不可用 63 磁盘未移动,但该磁盘上的子磁盘已移动 67 磁盘写入失败 52 磁盘正被另一集群使用 磁盘组版本不支持的功能 61磁盘组不存在 16, 62磁盘组错误 多磁盘故障 48 磁盘组没有有效的配置副本 53, 55, 56磁盘组配置副本出错。 61 磁盘组配置中没有更多的空间 当前不允许加入 66导入失败 56 丢失 vxconfigd 59更新失败 48 集群处理中出错 集群建立过程返回 配置后台驻留程序错误 61集群许可证操作 66 78 记录 volume 在磁盘组 diskgroup1 中,而 plex 在磁盘组 diskgroup2 中 57记录已存在于磁盘组中 62记录已关联 62加入在进行中 66节点激活冲突 66卷不可启动 14 卷的同步由于 I/O 错误而停止 24卷或 plex 设备已打开或已装入 62卷修复在进行中 65 另一个主机正在使用磁盘 56没有有效的 plex 47没有有效的完整 plex 50 没有找到包含磁盘组的有效磁盘 56没有这样的设备或地址 49没有这样的文件或目录 49名称与导入的磁盘组冲突 默认日志文件 35 某些配置副本出错 53, 55, 58 某些子磁盘不可用且奇偶校验失效 14内存分配失败 48 内核的版本号与 vxconfigd 不匹配 58配置副本的配置太大 63配置副本中的格式错误 53 配置更新中发生意外的内核错误 61配置记录不一致 53配置中的记录重复 53启动脚本 36启用失败 58, 61 请求越过了磁盘组界限 63 区别于已安装的 vxconfigd 版本 51日志记录 35设备已打开 49升级操作失败 68事务处理被禁用 61事务处理已在进行中 61试图禁用控制器失败 68 试图启用一个不可用的控制器 59所有事务处理均被禁用 48跳过具有重复名称的磁盘组 未用新主机 ID 更新 52无法重置 VxVM 内核 49 无法打开 /dev/vx/config 49无法导入磁盘组 69无法定位磁盘 69无法分配次要编号 65无法启动卷 47, 50 无法删除最后一个磁盘组配置副本 63无法为集群添加入口 65 VERITAS Volume Manager 故障排除指南无法修复临时数据库 60 无法在从属节点上找到磁盘 无法终止现有的后台驻留程序 59无法自动导入组 31, 53无效幻数 53无效块数 53 形成集群时后台驻留程序计数必须大于 60 虚拟磁盘设备已打开 49已在最高版本 68 因发生错误而禁用 31, 48 有两个磁盘组名称相同而磁盘组 ID 不同的备份 34 遇到此设备的重复 DA 记录 72在配置中未找到卷记录 ID 68找不到磁盘组的磁盘 56 至少超出一个节点的版本范围 67主节点没有发送数据 66组存在 63 G 告急信息 37故障 磁盘 9系统 8H 恢复 磁盘 7J 即时快照操作 从故障中修复 21技术援助 vii进程 ID 在命令日志记录文件中 26在事务日志文件中 28警告信息 37 mod_install 返回 errno 44plex 中的子磁盘发生故障 45RAID-5 卷进入退化模式操作 44RAID-5 日志操作中发生故障 43SAL 身份验证失败 70 重叠镜像 plex 从卷中分离 44重复的虚拟设备编号 57 磁盘采用组的名称,但组 ID 不同 52磁盘在组中标记为共享 51磁盘组被禁用 53 磁盘组日志可能太小 55从 SAL 检索信息时出错 70 错误 28 40 对象 plex 从卷中分离 39对象从 RAID-5 卷中分离 44接收到虚假的关闭指令 40卷重映射 57卷已分离 41 卷已经具有至少一个快照 plex 69 库和 vxconfigd 在客户机存在与否的问题上不一致 60 内核日志更新失败 43内核日志已满 43日志大小应该至少 55 日志对象从 RAID-5 卷中分离 43跳过该磁盘 51 未能记录 DRL 卷的分离 42未用新主机 ID 更新磁盘 53未找到磁盘设备 52无法创建设备 46无法打开日志文件 47 无法记录磁盘组 bootdg 的提交记录 40无法加入集群 42 无法纠正的读取错误 38无法纠正的写入错误 38无法派生以删除目录 46 无法执行 /bin/rm 以删除目录 46 无法执行 /usr/bin/rm 以删除目录 46遇到非法 vminor 43 在 RAID-5 上检测到双重故障情况 41在卷的镜像 plex 上发生读取错误 45找不到设备编号 39正从卷中分离 plex 47正在分离 RAID-5 40 组中的磁盘被主机锁定 51镜像卷,修复 5卷 DCO 修复 16 RAID-5 数据丢失 8重新启动禁用的 6列出不可启动的 2失效子磁盘,启动 15显示状态 2 修复 RAID-5 11修复镜像 5卷内核状态 DETACHED 10ENABLED 11卷状态 ACTIVE 11DEGRADED 9 79 索引 NEEDSYNC 12REPLAY 10SYNC 10, 12 K 客户机 ID 在命令日志记录文件中 26在事务日志文件中 28快照重同步 从错误中修复 24L 列出 不可启动的卷 2M 命令 日志记录 25与事务关联 28P 配置 备份文件 32解决备份冲突 34为磁盘组备份 31, 32为磁盘组恢复 31, 33R 热重定位 RAID-5 11已定义 1日志 plex 对于 RAID-5 的重要性 9修复 RAID-5 12日志记录 关联命令和事务 28命令和事务 25目录 25, 27日志文件 syslog 错误信息 36vxconfigd 35默认 35S 失效的奇偶校验 8事务 日志记录 27与命令关联 28数据丢失,RAID-5 8 T 通知消息 38通知信息 对象上的读取错误 45 根磁盘只有一条启用路径 39禁用 dmpnode 40 禁用连接到磁盘阵列的控制器 40禁用属于 dmpnode 的路径 41卷进入退化模式 49路径故障 44 配置副本正在脱机 57启用 dmpnode 42 启用连接到磁盘阵列的控制器 41启用属于 dmpnode 的路径 42删除磁盘阵列 45 试图禁用控制器失败 39 无法解决磁盘 ID 重复这一问题 71已分离磁盘 47已分离卷 51 已分离卷的日志 50已分离卷中的 plex 50已分离卷中的子磁盘 50已添加磁盘阵列 39退化模式,RAID-5 9W 文件 磁盘组配置备份 32X 系统故障 8写入时复制 从故障中修复 23Y 已分离的 RAID-5 日志 plex 12硬件故障,修复 1Z 致命错误信息 37 启动时内存分配失败 48状态 显示卷和 plex 2子磁盘 RAID-5 移动后修复 13标记为未失效 15失效,启动卷 15修复失效 RAID-5 13 80VERITAS Volume Manager 故障排除指南 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务