用户系统现状及需求分析
用户目前有一套政府会议办公系统,采用2台服务器互备,共享1台高速稳定盘阵,进行提供服务。
用户目前的需求是,要对这两台服务器提供不间断的保护,使得发生故障时系统应用对外服务不间断,出现问题时能快速对点播业务进行切换以保证点播系统的正常运行。同时要求磁盘阵列系统高速稳定,尽量减少单点故障,采用双控制器,冗余电源,硬盘保护,预警机制。
解决方案论述
1.HA集群解决方案
对于主机集群方式,将关键的应用服务器分别构建为双机热备系统,双机热备系统中任何的主机宕机、主机网络故障,在其上的应用系统会根据我们预先制定好的策略切换到相应的备援主机上,保证业务应用不停顿。
.解决方案拓扑图
解决方案工作流程
-
两台服务器通过SAS/或光纤总线连接到一个外存子系统
-
服务器通过网卡连接并经由SAS/或FC通道和一个网络上的监视线路(RS232串口线),侦测主服务器工作状态(故障发生原因如:电力,主机硬件,网络错误,应用软件等),当故障发生时,备援主机接替故障主机管理磁盘阵列,网络通讯,数据库等,HA 起的作用是主副机之间容错切换开关。
在备援机工作期间,用户只需进行几个简单的操作即可重新恢复系统。
系统说明
系统以windows/linux操作系统为平台,HK 磁盘阵列及HA for Sco UnixWare软件为核心,ORACLE数据库及网络数据存放在 磁盘阵列中,两台服务器只安装本地系统文件及软件,并作一主一从或双机双工的热备方式。
双机备份工作模式:
两台主机各安装一套ORACLE数据库软件和应用程序,建立主机系统结构的镜像模式。将数据库的系统库、数据库及日志建立在磁盘阵列提供的硬盘裸设备上,保证了其中任一台主机出现故障时,令外一台的数据库能继续访问数据库,通过主机切换进程的脚本文件实现应用程序的切换。保证应用业务的服务不停顿,和资料的安全。
使用两台服务器分别与磁盘阵列相连接,采用standby方式。一台主机(A机)为工作机,另一台主机(B机)为备份机。当A机运行时,B机处于闲置状态;当A机发生故障不能正常运转时,B机接管磁盘阵列继续运行,保证前置机系统能够不间断地运行。当A机修复启动后重新接管磁盘阵列,B机又恢复为备份机。磁盘阵列应使用RAID技术提高资料的安全性。
双机通过连接线缆,共享磁盘阵列。双机间由HA软件通过RS232线路和以太网线路进行监控,当一台主机宕机时另一台主机可迅速接管其数据库程序和应用程序,保证用户前台业务的持续运行。此种方案稳定性好、安全可靠、具有一定的网络均衡负载能力。
系统特点
硬件结合实现真正意义上的数据与系统分离。
对硬件配置要求不高,服务器可采用不同或相差较大的配置。
系统切换时间短,平均切换时间为30秒,为目前同类软件中最短。
切换过程对应用程序无影响(如柜台系统),无需重新启动或登录。
系统效率高。因为整个系统中数据读写、管理及容错由DA来完成。而系统从服务器故障纠错处理由HA软件来完成,而这两个都是相对独立的子系统。双机容错监控路径为LVD SAS 线路(80M/S)和RS232线路或10/100M自适应网卡线路,既不占用主机CPU资源也不占用基础网络带宽,因此系统效率高,这一点在实际的应用中得到券商的一致好评。
主要功能
自动侦测:
用户可通过高速SAS通道将两台主机共同连接到阵列柜,双机即可在此通道上相互检测到对方的“宕机”或“硬件错误”。
自动切换:
当侦测到任何一种硬件错误或宕机,HA立即执行自动切换功能,在极短时间内,数据转交到另一台主机,由它执行网络对数据的各种处理,确认切换后,故障恢复的过程就开始了,用户很快即会回到正常操作。
自动修复:
故障主机的恢复可选择两种方式,自动或人工两种方式都会很快完成修复工作
优势
-
最小停机时间,保护数据
-
最大的系统利用率
-
系统管理时间大大减少
-
其易操作的特点使维护费用减至最低
-
对运行状态可建立在线记录文档
-
IP地址计算
-
支持冗余以太网接口(仅使用于NT)
-
提供文件系统更换(Provides file system change)
-
用户可自设定启动顺序
-
自动数据库启动顺序/引擎(Automatic database start-up procedure/Engine)
-
故障书面警告
-
故障传真警告
-
故障快速恢复
可支持的操作系统
Unix SCO OpenServer Unixware
Linux Turbilinux
SUN Solaris
Windows NT Ver 3.51 4.0 Win2000 各种语言版
可支持的服务器系统
PC级服务器 IBM、 HP、 DEC、 NEC、 Aisino 、联想服务器、浪潮服务器等等
工作站级服务器 HP9000 SGI SUN等