首页 | 邮件资讯 | 技术教程 | 解决方案 | 产品评测 | 邮件人才 | 邮件博客 | 邮件系统论坛 | 软件下载 | 邮件周刊 | 热点专题 | 工具
网络技术 | 操作系统 | 邮件系统 | 客户端 | 电子邮箱 | 反垃圾邮件 | 邮件安全 | 邮件营销 | 移动电邮 | 邮件软件下载 | 电子书下载

操作系统

Windows 9X | Linux&Uinx | Windows Server | 其它操作系统 | Vista | FreeBSD | Windows 7 |
首页 > 操作系统 > Windows Server > 集群服务器共享磁盘柜的修复案例 > 正文

集群服务器共享磁盘柜的修复案例

出处:Fixhome 作者:Fixhome 时间:2006-9-25 9:51:00
  随着目前Windows 2000 服务器的大量应用,在比较关键性的业务平台上,都使用了基于Windows 2000 Cluster的集群服务器。集群服务器在几乎所有的故障点上都采用了冗余的手段保证系统的可用性。而以下的实例,则是由于Cluster软件的故障造成了无法对共享磁盘柜进行访问,也就从事实上导致了服务的不可用性,这是用冗余手段也难以解决的问题。笔者希望通过对此实例的分析,能带给大家一些解决集群故障的启示。

  应用硬件环境为两台服务器与一台RA4100磁盘柜通过光纤HUB组成了一个集群环境。运行软件环境为Microsoft Windows 2000 Advanced Server,使用Windows 2000自带的Cluster软件。

  错误现象

  系统启动后,发现集群服务无法正常启动,集群管理器也无法正常打开,在任一节点,打开资源管理器,都无法看到共享磁盘柜,相应安装在共享磁盘柜上的软件也就无法正常启动和使用。打开事件日志,可以发现以下错误:

  Event ID: 1019

  Event Type: Warning

  Event Source: ClusSvc

  Event Category: Log Mgr

  Description: The log file Q:MSCSquolog.log was found to be corrupt. An attempt will be made to reset it, or you should use the Cluster Administrator utility to adjust the maximum size.

  除以上比较明显描述的错误外,事件日志中还可以发现以下记录:

  Event ID:1067;Event ID: 1148

  解决方法

  从事件日志分析,quorum.log 文件出现了错误,导致了系统集群服务不能正常启动,解决问题的关键在于能够把quorum.log文件恢复到一个初始化状态,从而可以使系统集群服务正常启动。

  解决步骤

  1.通过-ResetQuorumLog参数来启动Cluster,以达到初始化quorum.log的目的。

  1)打开控制面板,双击“服务”(Service)图标;

  2)在服务管理器中找到Cluster service,右键点击“属性”(properties);

  3)在启动变量(Start Parameters)空白框中写入-ResetQuorumLog,启动Cluster服务。

  2.如果以上方法无法启动Cluster,则通过-NoQuorumLogging参数停止Cluster。

  步骤1不能正常启动Cluster服务,说明需要完全重建检查点和quorum.log文件,可以按以下步骤实施:

  1)打开控制面板,点击“服务”(Service)图标;

  2)在服务管理器中找到Cluster service,右键点击“属性”(properties);

  3)在启动变量(Start Parameters)空白框中写入-NoQuorumLogging,启动Cluster服务。

  然后,再次用-ResetQuorumLog参数来启动Cluster:

  4)打开共享磁盘柜,找到mscs目录,删除它;

  5)在服务管理器中找到Cluster service,右键点击“停止”,将Cluster服务停止;

  6)在服务管理器中找到Cluster service,右键点击“属性”(properties);

  7)在启动变量(Start Parameters)空白框中写入-ResetQuorumLog,再次启动Cluster服务;

  8)此时Cluster服务将正常运行,主节点将可成功访问共享资源。

  3.若此时集群中第二节点处在故障状态,可采用以下方法来解决。

  1)在开始选单的管理工具中打开集群管理器;

  2)点击出现故障的节点, 右击“evict”,使故障节点退出集群资源;

  3)在第二节点上重新安装Cluster服务,再次加入集群资源。

  案例思考

  集群的每个节点都在其本地计算机上维护一个集群服务数据库的拷贝。这个拷贝位于%SystemRoot%ClusterClusdb。当集群服务在一个节点上首次启动时,一个集群数据库的更新数据将注册到注册表的一个蜂巢中(HKEY_LOCAL_MACHINECluster)。当重新启动集群服务器时,一个存在的Cluster注册表将被使用。

  集群服务将Cluster的注册信息也保存在共享资源的一个文件中。检查点文件位于MscsChkxxx.tmp,每次检查点文件生效,都将把有关信息记录入MscsQuolog.log 文件中,以下四类情况将使Cluster服务产生检查点:

  ·主节点转移到另一节点上;

  ·任何节点上的Cluster服务停止;

  ·Quolog.log文件达到了其最大重置尺寸(在Windows 2000中为64KB);

  ·在注册表HKEY_LOCAL_MACHINECluster QuorumCheckpointInterval中设定了一个时间间隔,在Windows 2000中设置为4小时,如果在此时间间隔内Cluster没有任何变化时,也会产生一个检查点。

  此次集群服务启动失败,关键在于Quolog.log文件被破坏,所以此次修复的关键在于能够读取一个正常的Quolog.log文件。笔者采用的方法是:删除Mscs目录下的所有文件,然后设置参数-NoQuorumLogging让Cluster重建Quolog.log文件。这种操作有一定的风险,因为此时集群两个节点的状态的任何改变将无法被记录下来,从而也就无法保持两节点的一致性
  随着目前Windows 2000 服务器的大量应用,在比较关键性的业务平台上,都使用了基于Windows 2000 Cluster的集群服务器。集群服务器在几乎所有的故障点上都采用了冗余的手段保证系统的可用性。而以下的实例,则是由于Cluster软件的故障造成了无法对共享磁盘柜进行访问,也就从事实上导致了服务的不可用性,这是用冗余手段也难以解决的问题。笔者希望通过对此实例的分析,能带给大家一些解决集群故障的启示。

  应用硬件环境为两台服务器与一台RA4100磁盘柜通过光纤HUB组成了一个集群环境。运行软件环境为Microsoft Windows 2000 Advanced Server,使用Windows 2000自带的Cluster软件。

  错误现象

  系统启动后,发现集群服务无法正常启动,集群管理器也无法正常打开,在任一节点,打开资源管理器,都无法看到共享磁盘柜,相应安装在共享磁盘柜上的软件也就无法正常启动和使用。打开事件日志,可以发现以下错误:

  Event ID: 1019

  Event Type: Warning

  Event Source: ClusSvc

  Event Category: Log Mgr

  Description: The log file Q:MSCSquolog.log was found to be corrupt. An attempt will be made to reset it, or you should use the Cluster Administrator utility to adjust the maximum size.

  除以上比较明显描述的错误外,事件日志中还可以发现以下记录:

  Event ID:1067;Event ID: 1148

  解决方法

  从事件日志分析,quorum.log 文件出现了错误,导致了系统集群服务不能正常启动,解决问题的关键在于能够把quorum.log文件恢复到一个初始化状态,从而可以使系统集群服务正常启动。

  解决步骤

  1.通过-ResetQuorumLog参数来启动Cluster,以达到初始化quorum.log的目的。

  1)打开控制面板,双击“服务”(Service)图标;

  2)在服务管理器中找到Cluster service,右键点击“属性”(properties);

  3)在启动变量(Start Parameters)空白框中写入-ResetQuorumLog,启动Cluster服务。

  2.如果以上方法无法启动Cluster,则通过-NoQuorumLogging参数停止Cluster。

  步骤1不能正常启动Cluster服务,说明需要完全重建检查点和quorum.log文件,可以按以下步骤实施:

  1)打开控制面板,点击“服务”(Service)图标;

  2)在服务管理器中找到Cluster service,右键点击“属性”(properties);

  3)在启动变量(Start Parameters)空白框中写入-NoQuorumLogging,启动Cluster服务。

  然后,再次用-ResetQuorumLog参数来启动Cluster:

  4)打开共享磁盘柜,找到mscs目录,删除它;

  5)在服务管理器中找到Cluster service,右键点击“停止”,将Cluster服务停止;

  6)在服务管理器中找到Cluster service,右键点击“属性”(properties);

  7)在启动变量(Start Parameters)空白框中写入-ResetQuorumLog,再次启动Cluster服务;

  8)此时Cluster服务将正常运行,主节点将可成功访问共享资源。

  3.若此时集群中第二节点处在故障状态,可采用以下方法来解决。

  1)在开始选单的管理工具中打开集群管理器;

  2)点击出现故障的节点, 右击“evict”,使故障节点退出集群资源;

  3)在第二节点上重新安装Cluster服务,再次加入集群资源。

  案例思考

  集群的每个节点都在其本地计算机上维护一个集群服务数据库的拷贝。这个拷贝位于%SystemRoot%ClusterClusdb。当集群服务在一个节点上首次启动时,一个集群数据库的更新数据将注册到注册表的一个蜂巢中(HKEY_LOCAL_MACHINECluster)。当重新启动集群服务器时,一个存在的Cluster注册表将被使用。

  集群服务将Cluster的注册信息也保存在共享资源的一个文件中。检查点文件位于MscsChkxxx.tmp,每次检查点文件生效,都将把有关信息记录入MscsQuolog.log 文件中,以下四类情况将使Cluster服务产生检查点:

  ·主节点转移到另一节点上;

  ·任何节点上的Cluster服务停止;

  ·Quolog.log文件达到了其最大重置尺寸(在Windows 2000中为64KB);

  ·在注册表HKEY_LOCAL_MACHINECluster QuorumCheckpointInterval中设定了一个时间间隔,在Windows 2000中设置为4小时,如果在此时间间隔内Cluster没有任何变化时,也会产生一个检查点。

  此次集群服务启动失败,关键在于Quolog.log文件被破坏,所以此次修复的关键在于能够读取一个正常的Quolog.log文件。笔者采用的方法是:删除Mscs目录下的所有文件,然后设置参数-NoQuorumLogging让Cluster重建Quolog.log文件。这种操作有一定的风险,因为此时集群两个节点的状态的任何改变将无法被记录下来,从而也就无法保持两节点的一致性
相关文章 热门文章
  • TurboMail如何搭建与外网通信的局域网邮件服务器
  • 重命名域控制器和Exchange服务器
  • 终结邮件服务器攻击 采取措施阻止拒绝服务攻击和目录收集攻击
  • 帮您选择一款最好的免费邮件服务器
  • 七个免费邮件服务器软件
  • postfix+dovecot+postfixadmin+mysql架设邮件服务器
  • CentOS5.1上安装基于postfix的全功能邮件服务器(二)
  • CentOS5.1上安装基于postfix的全功能邮件服务器
  • CentOS安装配置Postfix邮件服务器
  • 在CentOS下用Postfix配置邮件服务器
  • 3分钟安装配置Postfix邮件服务器
  • Exchange Server 2010/2007第三方邮件中继服务器的使用方法
  • “http 500内部服务器错误”的解决方法
  • 利用Windows 2000 Server的RRAS实现VPN服务器
  • 用凤凰万能启动盘解决本地/域管理员密码丢失
  • Win2003 Server企业版安装配置
  • Active directory 灾难恢复
  • Windows 2000/03域和活动目录
  • 如何在vmware4上创建windows 2003群集
  • MSI文件制作全过程
  • Win2000命令全集(一)
  • Windows 2000/AD技巧
  • 此系统的本地策略不允许您采用交互式登录解决方法
  • Win2000路由的安装与设置实现不同网段互通
  • 自由广告区
     
    最新软件下载
  • SharePoint Server 2010 部署文档
  • Exchange 2010 RTM升级至SP1 教程
  • Exchange 2010 OWA下RBAC实现的组功能...
  • Lync Server 2010 Standard Edition 标..
  • Lync Server 2010 Enterprise Edition...
  • Forefront Endpoint Protection 2010 ...
  • Lync Server 2010 Edge 服务器部署文档
  • 《Exchange 2003专家指南》
  • Mastering Hyper-V Deployment
  • Windows Server 2008 R2 Hyper-V
  • Microsoft Lync Server 2010 Unleashed
  • Windows Server 2008 R2 Unleashed
  • 今日邮件技术文章
  • 腾讯,在创新中演绎互联网“进化论”
  • 华科人 张小龙 (中国第二代程序员 QQ...
  • 微软推出新功能 提高Hotmail密码安全性
  • 快压技巧分享:秒传邮件超大附件
  • 不容忽视的邮件营销数据分析过程中的算..
  • 国内手机邮箱的现状与未来发展——访尚..
  • 易观数据:2011Q2中国手机邮箱市场收入..
  • 穿越时空的爱恋 QQ邮箱音视频及贺卡邮件
  • Hotmail新功能:“我的朋友可能被黑了”
  • 入侵邻居网络发骚扰邮件 美国男子被重..
  • 网易邮箱莫子睿:《非你莫属》招聘多过..
  • 中国电信推广189邮箱绿色账单
  • 最新专题
  • 鸟哥的Linux私房菜之Mail服务器
  • Exchange Server 2010技术专题
  • Windows 7 技术专题
  • Sendmail 邮件系统配置
  • 组建Exchange 2003邮件系统
  • Windows Server 2008 专题
  • ORF 反垃圾邮件系统
  • Exchange Server 2007 专题
  • ISA Server 2006 教程专题
  • Windows Vista 技术专题
  • “黑莓”(BlackBerry)专题
  • Apache James 专题
  • 分类导航
    邮件新闻资讯:
    IT业界 | 邮件服务器 | 邮件趣闻 | 移动电邮
    电子邮箱 | 反垃圾邮件|邮件客户端|网络安全
    行业数据 | 邮件人物 | 网站公告 | 行业法规
    网络技术:
    邮件原理 | 网络协议 | 网络管理 | 传输介质
    线路接入 | 路由接口 | 邮件存储 | 华为3Com
    CISCO技术 | 网络与服务器硬件
    操作系统:
    Windows 9X | Linux&Uinx | Windows NT
    Windows Vista | FreeBSD | 其它操作系统
    邮件服务器:
    程序与开发 | Exchange | Qmail | Postfix
    Sendmail | MDaemon | Domino | Foxmail
    KerioMail | JavaMail | Winwebmail |James
    Merak&VisNetic | CMailServer | WinMail
    金笛邮件系统 | 其它 |
    反垃圾邮件:
    综述| 客户端反垃圾邮件|服务器端反垃圾邮件
    邮件客户端软件:
    Outlook | Foxmail | DreamMail| KooMail
    The bat | 雷鸟 | Eudora |Becky! |Pegasus
    IncrediMail |其它
    电子邮箱: 个人邮箱 | 企业邮箱 |Gmail
    移动电子邮件:服务器 | 客户端 | 技术前沿
    邮件网络安全:
    软件漏洞 | 安全知识 | 病毒公告 |防火墙
    攻防技术 | 病毒查杀| ISA | 数字签名
    邮件营销:
    Email营销 | 网络营销 | 营销技巧 |营销案例
    邮件人才:招聘 | 职场 | 培训 | 指南 | 职场
    解决方案:
    邮件系统|反垃圾邮件 |安全 |移动电邮 |招标
    产品评测:
    邮件系统 |反垃圾邮件 |邮箱 |安全 |客户端
    广告联系 | 合作联系 | 关于我们 | 联系我们 | 繁體中文
    版权所有:邮件技术资讯网©2003-2010 www.5dmail.net, All Rights Reserved
    www.5Dmail.net Web Team   粤ICP备05009143号