プロセス監視

「システムは止めてはならない」

どのようなシステムもそうですが、
証券システムはその最たるものです

トレーダーはその瞬間の売買、1秒1秒を勝負していますから
システムが止まって売買ができなければ損を被るわけです

システムの可用性を語る時に
プロセス障害時のフェイルオーバーの仕掛けが必要になってきます

Serviceguardのような製品でパッケージを組んでフェイルオーバーすることもあれば・・・

http://h50146.www5.hp.com/products/software/oe/hpux/component/ha/serviceguard.html

監視用シェルを用意して障害の検知及びフェイルオーバーを仕掛ける場合もあります

監視用シェルは監視対象のプロセスとは別サーバーに配置します

なぜなら、プロセスの障害のうちサーバー障害などのH/W障害が起因の場合
監視用シェルも同様にダウンしてしまうからです

監視用シェルの大まかな仕掛けとしてはこんな感じでしょうか

(1)pingでサーバー疎通確認
(2)remshでpsコマンド等を実施して監視対象のプロセスの起動を確認
 ⇒バックグラウンドでremshを実行する場合、
  監視シェル側でremshが完了したかを確認する
  一定時間remshが終わってなければ問題があるため障害とする
(3)(2)確認結果から障害か否かを判断
 ⇒障害であれば待機系フェイルオーバーさせる

製品の導入が一番確実ですが、
なかなか高価なものなのでどこにでも導入するというのは現実的ではないですね