[ 2004/11/06 00:18 | by 网络毛毛虫 ]
| |
各关键业务单位对服务器应用系统的安全性,可用性,依赖性较强,关键应用24小时不允许停机,在这种情况下,服务器的双机热备就显的非常必要及迫切。
  双机热备是近年来服务器端的安全性,可用性的一次重大的革命。从以前加大的硬件可用性,到现在的双机备用,来保证服务器的不停机运行,是高可用性的一次重大的进步。
  双机热备的原理:是当一台服务器在工作时(称为主机)。另一台服务器作备用状态(称为备机)。当主机因为某种原因出现故障,如死机,主机断电,病毒发作,硬盘损坏等,不能继续提供服务时,从机能够在规定的时间内接替主机的服务,继续提供服务,从而达到不停机的服务。


  典型用户环境简介
  用户服务器操作系统使用的是Windows NT、WIN2000、SCO OPENSERVER,数据库为SQL SERVER、ORACAL、Sybase,客户端的使用的是管理系统。
  其中数据库是重点的保护对象。
  设计的以下双机容错解决方案:
  一:用户硬件环境:
  服务器主机,配置如下:CPU PIII1.13以上,1G ECC内存,18GB硬盘2块RAID1。
  磁盘柜一台, U3 18GB或更大容量SCSI热插拔硬盘3块以上。
  二:软件环境:
  操作系统一套;数据库系统一套。
  双机容错软件(ROSE HA或其它OEM ROSE双机软件) 一套
  三:网络拓扑图:


  双机的应用包括双机互被援(Dual Active);双机热备份(Hot Standby)
  双机互被援工作原理是两台服务器均为工作机,在正常情况下,两台工作机均为信息系统提供支持,并互相检测对方的运行情况。当一台主机出现异常时,不能支持信息系统正常运营,另一主机主动接管异常机的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行。
  双机热备份的工作原理就是一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server),在系统正常情况下,工作机为信息系统提供服务,备份机监视工作机的运行情况(工作机同时也在检测备份机是否正常),当工作机出现异常,不能支持信息系统运营时,备份机主动接管工作机的工作,继续支持信息的服务,保证系统不间断的运行。


  双机能实现的功能
  ● 服务器停电时,能实现自动切换
  ● 服务器的硬盘、CPU、RAM发生故障时,实现自动切换
  ● 网络连接发生故障时(如网卡、网线故障),实现自动切换
  ● 操作系统、数据库或应用程序发生故障时,应能实现自动切换
  ● 提供手动切换功能,使系统管理员可以在主机负载过大时或其它适当的时候,实现手动切换。
  ● 安全完成切换多次
  ● 互相检测机器的工作状态,保证双机的可靠性
  ● 保留完整的系统日志
  三、安装方法:  
   1、先把主机的数据库移到一台备用的服务器上,并调试成功,供用户使用。
   2、安装两台服务器,首先,创建磁盘阵列的RAID5保护机制,主要步骤是:在主机做RAID5,做完后再在从机做RAID5。
   3、开始安装操作系统软件包。
   4、安装双机软件,并做卷的保护,以下安装数据库软件,把应用系统安装在服务器硬盘上,数据库安装在磁盘阵列上。
  5、做双机软件的数据库资源保护。在新装的数据库中恢复备用机的数据库数据。
  四,做切换实验:(双机软件)
  切换实验步骤如下:
  1:手工切换,在系统的正常的情况下,手工从主机切到备机,这种功能主要用于系统的定期维护。实验结果,切换正常。
  2:宕机切换,这种切换模拟服务器突然出现故障的情况,在这种情况下,备机应在规定的时间内起动数据库服务,并开始对外服务。实验结果,切换正常。
  3:模拟网卡故障,双机软件对系统资源有检测能力,当网卡出现故障后,客户机找不到此IP地址,故客户机无法使用,在这种情况下,双机软件应检测到此故障,并切往备用机,制造此故障,我们用拔网线的方法,此时用户无法登录。实验结果是双机软件检测到此故障,并切到备用机。
  4:模拟数据库故障:双机软件还可以对数据库进行检测,当操作系统正常的情况下,数据库出现故障,此时双机软件同样可以检测到此故障,实验结果是,主机资源切换到备用服务器。
  五、验收结果
  由以上的切换实验,可以得出双机软件应是可靠的主机容错系统,它支持开放的大型数据库系统,并提供最多的容错能力(如操作系统,数据库,网卡等)。适合于企事业单位本身要求计算机网络系统具有高可靠,高可用性而且网络系统可以可靠、高速、稳定的运行。
  在出现故障的情况下,双机软件会将保护资源自动转换到一个根据优先权而设定的系统。在实际进行切换用户时, 会经历一个十分短暂的休眠,但是,当系统完成了切换操作后,双机软件会在所选择的系统上自动地恢复操作。
  1、可以被双机软件保护起来的资源是:
  1、 卷(Volume)
  2、 IP 地址
  3、 共享文件
  4、 LAN(局域网)管理器服务器名称
  5、 应用程序
  6、 定义的用户
  7、 MSCS应用程序
  2、心跳故障检测
  双机软件在集群节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制。即通过每一个通信路径,在两个对等系统之间进行周期性的握手,如果连续没有收到的心跳信号到了一定的数目,双机软件就把这条路径标示为失效。
  如果你只定义了一条通信路径,当双机软件把这唯一的一条通信路径标为失效时,双机软件便立即开始恢复过程。然而,如果你有冗余路径, 双机软件能够通过第二条路径确定是系统故障还是只是通信路径有问题。如果双机软件开启优先级第二的通信路径并收到了心跳信号,它就不开始双机软件恢复,只需要把第一条通信路径标成红色,作为信号告诉你需要修理一下有故障的路径。
一般情况下双机软件只在下列事件发生时,启动系统恢复功能:
  1、 所有的通信路径故障。如果所有节点都没能收到心跳信号, 把所有通信路径都标为失效,双机软件开始安全检查。
  2、 安全检查失败。当所有通信路径故障时,双机软件向整个网络发出安全检查信号。如果信号指出配对系统还“活”着的时候,双机软件不启动Failover。如果安全检查没从配对节点返回信号,Rose ha 就开始Failover。
  因而,为了减少由于潜在的通讯错误所引起的不必要的系统切换,建议您使用不同介质的多条通信路径。
  3、 通信路径
双机软件支持在节点之间和心跳通讯中,使用如下通讯路径:
  (1) socket,即套接字。你使用任何的网络硬件接口,只要它能够支持TCP/IP的通讯协议。这样的硬件包括:以太网、快速以网、令牌环网以及FDDI 或CDDI 。
  (2)串行口 在双机软件配置中, 你应当配置有一个串行口通信路径。串口通信路径需要利用RS232的拟调解线路来与双机软件系统相连接。
(  3)共享磁盘 你可以定义一个共享磁盘分区来作为双机软件的通讯中介。可以只使用小至1MB的分区,当然,也可以使用更大的空间。
  双机软件假定,当通过心跳信号检测其它服务器失败时,则认为此服务器是关闭的。因此,为了避免不必要的失效切换,最好建立两种以上独立的物理路径,使用至少两种心跳。
技术文章 | 评论(1) | 引用(0) | 阅读(2827)
ffff
2009/06/02 09:46
shuai fdgsgfds ffds
分页: 1/1 第一页 1 最后页
 
发表评论
   
表情
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
打开HTML
打开UBB
打开表情
隐藏
记住我
昵称   密码   游客无需密码
网址   电邮   [注册]