サーバエンジニアのお仕事その2
07.11.10 / サーバ管理のこと / Author: aico / Comments: (1)
今回は運用保守業務について教えてもらいました!
サーバエンジニアのお仕事は構築1割、運用保守業務9割ってくらいとにかく保守!保守!保守!なんだとか?
…というわけで、運用保守業務はどんな仕事をしているのか見てみましょう!
サーバエンジニアの運用保守業務はこんなかんじです。
1つ目は設定変更。
例えば、メールサーバなら人数が増えたからアドレスを追加するとか、Webサーバならキャンペーンがあるから、いつもより多めに人数がきても大丈夫なようにする(チューニング)などの設定変更があります。
次は監視・障害対応・原因調査・ログ解析です。
telnetで80番ポートに接続したときに見たステータコード覚えてますか?
このステータスコードが200 OKと出ているか監視専用のプログラム(nagiosとか)をつかって自動的に確認します。これが監視です。
ステータスコードは400や500代のエラーコードがでてしまうと障害が起きているので、メールでアラートが飛ぶようにしたりします。
で、ブーブーなったので、障害対応をしましょう。
エラーが飛んできた時、ログを見たり、ステータスコードのエラーコードをみたりして復旧のために原因を探します。
障害の原因としては、ハードが壊れて起動していなかったり、プログラムミスやアクセス過多などが考えられます。
また、のちのち障害の原因はなんだったの?と聞かれたり、アラートが飛ばなくてもサーバが重かった!なんてことをお客様に言われたりします。
そのときのためにも原因調査の準備をしておくことが大事です。
障害がおきているときにサーバにログインしていれば、原因調査もできますが、あとあとになって調べるのはなかなか大変です。そのため、日々の状態を記録させる設定(原因調査の為の事前準備)をしておくことが大事です。
標準的にOSが取得しているデータもありますが、追加で取得設定しないといけないものもあります。
たとえばCPUの使用率やネットワークの使用率などのログです。
さらにログをせっかくとっても文字や数値ばかりではよくわからない!そのためログをグラフ化(ログ解析)するなどもおこないます。
障害対応のときよく見るのはログですが、このログ常日頃から解析をしておくことでより速く原因をつきとめられるようになります! はやりの「見える化」ですね。
前回の構築業務でもありましたが、サーバを運用する際、バックアップをとっておく必要があります。
バックアップをとるように設定しておいても本当にとれているのか?ってことを自動で確認したり、データが消えてしまったからバックアップしてあったものを戻す(リカバリー)などの作業をします。
NO MORE!WARUUSA!と言ってもやはり悪うささんは存在するもの。そのため、定期的に悪うささんから攻撃されていないかチェックしたり、セキュリティ的に悪うさ対策できているかをチェックしたりします。予防対策ってことですね!
これまでのことも相談されてのことですが、例えばプログラムのことなどサーバのこと以外の相談をされることもあるんだとか。
そのため、サーバエンジニアとしてそんなに必要なくてもプログラムのことも少しは知っておいた方がいいかも?(サーバの勉強だけでも大変なのに!笑)