RoseHA

RoseHA高可用系統解決方案,由兩臺服務器和一臺共享存儲設備組成主要硬件環境,通過RoseHA持續、穩定、高效的軟件系統,實現兩個節點的高可用功能。采用Rose基于共享存儲的高可用解決方案,實現企業關鍵業務7×24小時不間斷運營,是企業重要考量。
RoseHA的工作原理
RoseHA雙機系統的兩臺服務器(主機)都與磁盤陣列(共享存儲)系統連接,用戶的操作系統、應用軟件和RoseHA高可用軟件分別安裝在兩臺主機上,數據庫等共享數據存放在存儲系統上,兩臺主機之間通過私用心跳網絡連接。配置好的系統主機開始工作后,RoseHA軟件開始監控系統,通過私用網絡傳遞的心跳信息,每臺主機上的RoseHA軟件都可監控另一臺主機的狀態。當工作主機發生故障時,心跳信息就會產生變化,這種變化可以通過私用網絡被RoseHA軟件捕捉。當捕捉到這種變化后RoseHA就會控制系統進行主機切換,即備份機啟動和工作主機一樣的應用程序接管工作主機的工作(包括提供TCP/IP網絡服務、存儲系統的存取等服務)并進行報警,提示管理人員對故障主機進行維修。當維修完畢后,可以根據RoseHA的設定自動或手動再切換回來,也可以不切換,此時維修好的主機就作為備份機,雙機系統繼續工作。
RoseHA實現容錯功能的關鍵在于,對客戶端來說主機是透明的,當系統發生錯誤而進行切換時,即主機的切換在客戶端看來沒有變化,所有基于主機的應用都仍然正常運行。RoseHA采用了虛擬IP地址映射技術來實現此功能?蛻舳送ㄟ^虛擬地址和工作主機通訊,無論系統是否發生切換,虛擬地址始終指向工作主機。在進行網絡服務時,RoseHA提供一個邏輯的虛擬地址,任何一個客戶端需要請求服務時只需要使用這個虛擬地址。正常運行時,虛擬地址及網絡服務由主服務器提供。當主服務器出現故障時,RoseHA會將虛擬地址轉移到另外一臺服務器的網卡上,繼續提供網絡服務。切換完成后,在客戶端看來系統并沒有出現故障,網絡服務仍然可以使用。除IP地址外,HA還可以提供虛擬的計算機別名供客戶端訪問。對于數據庫服務,當有主服務器出現故障時,另外一臺服務器就會自動接管,同時啟動數據庫和應用程序,使用戶數據庫可以正常操作。
RoseHA主要功能特點
【簡潔直觀的管理方式】
RoseHA提供了友好直觀的圖形安裝界面和監控管理界面。通過直觀而又方便的Java Applet管理界面,用戶可以交互式地對集群系統進行配置、監控和管理,并可以利用Applet的網絡特性,通過網絡對系統進行遠程管理,實時地顯示出主機系統及服務的狀態。
【靈活的高可用應用模式】
RoseHA支持Active-Active模式和Active-Standby模式。用戶可指定每臺服務器的作用(active or standby),指定要監控的服務和硬件部分,定義指定的服務發生故障后要采取的進一步行動(如是否重新啟動該服務、允許的******啟動時間等)。
【適應復雜網絡環境】
1. 在網絡環境中,每個IP與唯一的MAC綁定在一起。而傳統的集群結構下,將致使集群的活動IP在不同時刻綁定不同的MAC地址,導致跨網段通信出現問題。為了使集群軟件更好的支持這種網絡安全級別較高的網絡環境,RoseHA提供了支持虛擬MAC地址的功能,使集群環境IP地址實現與唯一MAC地址綁定。
2. RoseHA支持IPV4網絡通信協議以及未來適用的IPV6網絡通信協議。
【支持動態卷切換機制】
1. 支持Windows 2008 R2以后的平臺上的動態卷,增強卷切換的效率。
2. 支持Linux平臺LVM卷設備切換。
【集群的容錯可靠性】
1. RoseHA集群具有容錯可靠性,RoseHA集群的拓撲包括兩臺服務器和一臺磁盤陣列,硬件實現了容錯可靠。
2. RoseHA具有兩個核心進程,它們互相監控,如果其中一個進程失敗,另一個進程會立即進行恢復,避免了RoseHA自身服務的單點故障。
3. RoseHA支持Socket和RS232兩種類型的心跳,配置多條心跳路徑可以避免心跳的單點故障。
4. 支持仲裁盤,RoseHA提供磁盤仲裁資源。即使集群節點間通信全部斷開,也能通過仲裁資源來確定集群的運行狀態,避免集群節點間的資源競爭。
【豐富的附加功能】
提供不同的針對特定應用的Agent程序,使服務監控更切實際,更加有效。
【系統資源監控】
深度和持續監測系統運行狀態,智能分析系統資源使用情況,保障系統資源環境的健康穩定(包含CPU,內存) 。
【集群環境監控】
主備節點上的RoseHA集群服務通過IP網絡鏈路互相通信,傳遞應用程序及主服務器運行狀態信息。
當集群服務因諸如網絡阻塞、網卡故障、網絡運營服務中斷等網絡故障,或者服務器電源故障、服務器宕機、系統維護等服務器故障等原因,無法在預設的時間范圍內應答對方節點發送的心跳信息,都有可能造成RoseHA心跳超時,所以建議管理員配置2條或3條IP網絡作為私網心跳,避免因網絡擁塞、服務器繁忙等非常規性網絡或服務器故障,造成集群間通信不暢的情況發生。