忍者ブログ

インフラ構築手順書

はじめてのインフラ、サーバ構築時に役に立つように構築手順情報をまとめました。


[PR]

広告 

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。



DRBD構築時に発生したエラー

広告 

DRBD構築時に発生したエラー

DRBDを構築時に遭遇したエラーとその解決手順を説明します。

DRBD構築時に遭遇したエラー一覧

メタデータ領域の初期化でエラー発生(ignored, since this host ....)
DRBD起動時のエラー(Failure: (112) Meta device too small.)



メタデータ領域の初期化でエラー発生(ignored, since this host ....)

■メタデータ領域の初期化で発生するエラー
# drbdadm create-md db01
&#039db01&#039 ignored, since this host (dev-db1) is not mentioned with an &#039on&#039 keyword.
□解決手順
/etc/drbd.confのホスト名の定義(on hostname{・・・・)と「uname -n」の実行結果が異なることが原因のため、定義をあわせる。

・ホスト名の確認
# uname -n
dev-db01
・/etc/drbd.confファイルの定義変更
# vi /etc/drbd.conf
  on dev-db01 {
    device     /dev/drbd0;
    disk       /dev/sdb2;
    address    192.168.100.104:7788;
    meta-disk  /dev/sdb1[0];
}


DRBD起動時のエラー(Failure: (112) Meta device too small.)

■DRBD起動時のエラー
#drbdadm up db01
0: Failure: (112) Meta device too small.
Command 'drbdsetup 0 disk /dev/sdb2 /dev/sdb1 0 --set-defaults --create-device --on-io-error=call-local-io-error' terminated with exit code 10
□解決手順
メタデータ領域として128MBより大きい値でないとエラーがでるようである。
メタデータ領域を再作成し、再度実施する。



PaceMaker+DRBDの運用関連記事

PaceMaker+DRBDの実践運用手順
DRBDのエラー対応
DRBDの基本コマンド


HeartBeat2+DRBD構築【目次】

01. HeartBeat2+DRBD構築  【DRBD構築手順】
02. HeartBeat2+DRBD構築  【DRBDの起動と確認】
03. HeartBeat2+DRBD構築  【HeartBeat 基本設定】
04. HeartBeat2+DRBD構築  【HeartBeat リソース設定】
05. HeartBeat2+DRBD構築  【Heart運用手順】
06. HeartBeat2+DRBD構築  【DRBD障害対応】
07. HeartBeat2+DRBD構築  【DRBD構築時に発生したエラー】
08. 「HeartBeat+DRBD」の構築手順に役立つ書籍


拍手[0回]



HeartBeat2+DRBD構築 【DRBD障害対応】

広告 

HeartBeat2+DRBD構築 【DRBD障害対応】

DRBDにおいて、スプリットブレインが発生した場合の障害対応を説明します。

※スプリットブレイン
ネットワークの異常等のせいで本番系と待機系の間のハートビートのやり取りができなくなり、待機系が本番系が停止したと判断し本番系として起動して2台とも本番系となってしまう現象

DRBDのスプリットブレインを確認

障害側サーバでスプリットブレインを確認
・/proc/drbdで確認
# cat /proc/drbd
version: 8.3.8 (api:88/proto:86-94)
GIT-hash: d78846e52224fd00562f7c225bcc25b2d422321d build by mockbuild@builder10.centos.org, 2010-06-04 08:04:09
0: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown   r----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:516

・/var/log/messagesで確認
# cat /var/log/messages
May 18 13:03:46 dev-db02 kernel: block drbd0: Split-Brain detected but unresolved, dropping connection!


正常側サーバでスプリットブレインを確認
・/proc/drbdで確認
#  cat /proc/drbd
version: 8.3.8 (api:88/proto:86-94)
GIT-hash: d78846e52224fd00562f7c225bcc25b2d422321d build by mockbuild@builder10.centos.org, 2010-06-04 08:04:09
0: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown   r----
    ns:0 nr:0 dw:1110652 dr:4109 al:52 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:132684


DRBDのスプリットブレインから復旧する手順

スプリットブレインからの復旧手順(方法1)
drbdサービスの再起動、またはOS再起動でもなおることを確認
※この方法は、あまりお勧めできません。方法2をお試しください。


スプリットブレインからの復旧手順(方法2)
「StandAlone」状態から復旧
【障害側サーバ】
[db2 ~]# drbdadm down all
# drbdadm down all
# cat /proc/drbd
version: 8.3.8 (api:88/proto:86-94)
GIT-hash: d78846e52224fd00562f7c225bcc25b2d422321d build by mockbuild@builder10.centos.org, 2010-06-04 08:04:09
0: cs:Unconfigured
[db2 ~]# drbdadm attach all
# drbdadm attach all
# cat /proc/drbd
version: 8.3.8 (api:88/proto:86-94)
GIT-hash: d78846e52224fd00562f7c225bcc25b2d422321d build by mockbuild@builder10.centos.org, 2010-06-04 08:04:09
0: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown   r----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:516
[db2 ~]# drbdadm invalidate all
# drbdadm invalidate all
# cat /proc/drbd
version: 8.3.8 (api:88/proto:86-94)
GIT-hash: d78846e52224fd00562f7c225bcc25b2d422321d build by mockbuild@builder10.centos.org, 2010-06-04 08:04:09
0: cs:StandAlone ro:Secondary/Unknown ds:Inconsistent/DUnknown   r----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:6152896
[db2 ~]# drbdadm connect all
# drbdadm connect all
# cat /proc/drbd
version: 8.3.8 (api:88/proto:86-94)
GIT-hash: d78846e52224fd00562f7c225bcc25b2d422321d build by mockbuild@builder10.centos.org, 2010-06-04 08:04:09
0: cs:WFConnection ro:Secondary/Unknown ds:Inconsistent/DUnknown C r----
    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:6152896
【正常側サーバ】
[db1 ~]# drbdadm connect all
# drbdadm connect all
#  cat /proc/drbd
version: 8.3.8 (api:88/proto:86-94)
GIT-hash: d78846e52224fd00562f7c225bcc25b2d422321d build by mockbuild@builder10.centos.org, 2010-06-04 08:04:09
0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r----
    ns:13420 nr:0 dw:1110652 dr:23181 al:52 bm:0 lo:58 pe:30 ua:234 ap:0 ep:1 wo:b oos:6140416
        [>....................] sync'ed:  0.3% (5996/6008)M delay_probe: 0
        finish: 0:31:58 speed: 3,120 (3,120) K/sec
同期が開始される



PaceMaker+DRBDの運用関連記事

PaceMaker+DRBDの実践運用手順
DRBDのエラー対応
DRBDの基本コマンド


HeartBeat2+DRBD構築【目次】

01. HeartBeat2+DRBD構築  【DRBD構築手順】
02. HeartBeat2+DRBD構築  【DRBDの起動と確認】
03. HeartBeat2+DRBD構築  【HeartBeat 基本設定】
04. HeartBeat2+DRBD構築  【HeartBeat リソース設定】
05. HeartBeat2+DRBD構築  【Heart運用手順】
06. HeartBeat2+DRBD構築  【DRBD障害対応】
07. HeartBeat2+DRBD構築  【DRBD構築時に発生したエラー】
08. 「HeartBeat+DRBD」の構築手順に役立つ書籍


拍手[0回]



HeartBeat2+DRBD構築  【Heart運用手順】

広告 

HeartBeat2+DRBD構築  【Heart運用手順】

HeartBeatの運用手順

PostgreSQLを再起動する場合【Heart運用手順】
リソースのスイッチオーバ【Heart運用手順】
障害発生後の後処理【Heart運用手順】



PostgreSQLを再起動する場合【Heart運用手順】

・Heartbeat管理から外す
# crm_resource -p is_managed -r pgsql_4 -t primitive -v off

・独自監視(drbd_postgres_watch.sh)を追加している場合下記のコマンドを実行する
#/opt/scripts/hb/drbd_postgres_watch.sh  suspend
※独自監視(drbd_postgres_watch.sh)のCHKDIR変数の値のディレクトリがあることを確認($DBROOT/hb_check)

・PostgreSQLのメンテナンス(再起動)
# /etc/init.d/postgresql restart

・Heartbeat管理下に戻す
# crm_resource -p is_managed -r pgsql_4 -t primitive -v on

・独自監視(drbd_postgres_watch.sh)の再開
 # /opt/scripts/hb/drbd_postgres_watch.sh  resume

※注意事項
再起動ではなく停止すると、以下のステータスになる。
[pgsql_4 (heartbeat::ocf:pgsql): Started dev-db01 (unmanaged) FAILED]
Resource Group: group_1
    drbddisk_1  (heartbeat:drbddisk):   Started dev-db-01
    Filesystem_2        (heartbeat::ocf:Filesystem):    Started dev-db01
    IPaddr_172_18_50_105        (heartbeat::ocf:IPaddr):        Started dev-db01
    pgsql_4     (heartbeat::ocf:pgsql): Started dev-db01 (unmanaged) FAILED
    MailTo_1    (heartbeat::ocf:MailTo):        Started dev-db01

Failed actions:
    pgsql_4_monitor_120000 (node=dev-db01, call=191, rc=7): complete

しかし,PostgreSQLを起動すると[FAILED],[Faield actions:]は消える。
Resource Group: group_1
    drbddisk_1  (heartbeat:drbddisk):   Started dev-db01
    Filesystem_2        (heartbeat::ocf:Filesystem):    Started dev-db01
    IPaddr_172_18_50_105        (heartbeat::ocf:IPaddr):        Started dev-db01
    pgsql_4     (heartbeat::ocf:pgsql): Started dev-db01 (unmanaged)
    MailTo_1    (heartbeat::ocf:MailTo):        Started dev-db01
※「(unmanaged)」は、「crm_resource -p is_managed -r pgsql_4 -t primitive -v on」を実行すると消える。

HeartBeat管理下から外した状態で、HeartBeatを停止することはできません。待ちの状態になりHeartbeat終了ができません。 そんなときは、管理下に戻す必要があります。【ON】



リソースのスイッチオーバ【Heart運用手順】

アクティブからスタンバイへ(強制フェールオーバ)
・アクティブサーバ上
# crm_standby -U `hostname` -v on

・フェールオーバを確認
# crm_mon
Defaulting to one-shot mode
You need to have curses available at compile time to enable console mode
============
Last updated: Fri Jul 15 12:45:56 2011
Current DC: dev-db01 (749e05b9-1610-44a6-9c01-dfd37fea7372)
2 Nodes configured.
1 Resources configured.
============

Node: dev-db01 (749e05b9-1610-44a6-9c01-dfd37fea7372): standby
Node: dev-db02 (81312dbc-9b48-444c-b669-203c84055c1f): online

Resource Group: group_1
    drbddisk_1  (heartbeat:drbddisk):   Started dev-db02
    Filesystem_2        (heartbeat::ocf:Filesystem):    Started dev-db02
    IPaddr_172_18_50_105        (heartbeat::ocf:IPaddr):        Started dev-db02
    pgsql_4     (heartbeat::ocf:pgsql): Started dev-db02
    MailTo_1    (heartbeat::ocf:MailTo):        Started dev-db02

・フェイルオーバしたことを確認後、スタンバイONをスタンバイOFFに戻す。
# crm_standby -U `hostname` -v off

・onlineになっていることを確認する
# crm_mon
 : 
省略
 :
Node: dev-db01 (749e05b9-1610-44a6-9c01-dfd37fea7372): online
Node: dev-db02 (81312dbc-9b48-444c-b669-203c84055c1f): online

Resource Group: group_1
    drbddisk_1  (heartbeat:drbddisk):   Started dev-db02
    Filesystem_2        (heartbeat::ocf:Filesystem):    Started dev-db02
    IPaddr_172_18_50_105        (heartbeat::ocf:IPaddr):        Started dev-db02
    pgsql_4     (heartbeat::ocf:pgsql): Started dev-db02
    MailTo_1    (heartbeat::ocf:MailTo):        Started dev-db02
※スタンバイ状態でサーバを再起動をするとHeartbeatが起動してこないので、手動で起動する必要があります。



障害発生後の後処理【Heart運用手順】

・障害リソースのクリーンアップ処理 ※障害リソースの原因究明し、問題解決した場合は以下のコマンドで障害履歴?を消す。
この作業をしないと次のフェイルオーバに失敗する。
# crm_resource -C -H `uname -n` -r pgsql_4
※「`uname -n`」は、 障害発生したサーバ名を指定する。
※「pgsql_4」は障害発生したリソース名
※crm_monを実行したときに下記のようなメッセージが消えれば、次回障害時に正常にフェイルオーバが発生する。

Failed actions:
pgsql_4_start_0 (node=dev-db01, call=75, rc=-2): Timed Out




HeartBeat2+DRBD構築【目次】

01. HeartBeat2+DRBD構築  【DRBD構築手順】
02. HeartBeat2+DRBD構築  【DRBDの起動と確認】
03. HeartBeat2+DRBD構築  【HeartBeat 基本設定】
04. HeartBeat2+DRBD構築  【HeartBeat リソース設定】
05. HeartBeat2+DRBD構築  【Heart運用手順】
06. HeartBeat2+DRBD構築  【DRBD障害対応】
07. HeartBeat2+DRBD構築  【DRBD構築時に発生したエラー】
08. 「HeartBeat+DRBD」の構築手順に役立つ書籍



拍手[0回]



Yahoo!ブックマーク Googleブックマーク はてなブックマーク livedoorClip del.icio.us FC2 ニフティクリップ iza Buzzurl 


最新記事
(09/17)
(04/09)
(04/09)
(03/22)
(01/16)
(12/30)
(12/26)
(09/21)
(09/21)
(09/20)
(09/12)
(06/13)
(06/13)
(03/14)
(02/15)
(01/03)
(01/03)
(10/04)
(09/20)
(09/15)
(09/14)
(09/14)
(09/14)
(09/06)
(08/30)
最古記事
(10/29)
(10/29)
(10/29)
(10/29)
(10/29)
(04/12)
(04/12)
(06/12)
(06/12)
(06/20)
(06/22)
(07/22)
(07/22)
(07/30)
(07/30)
(08/18)
(08/18)
(08/22)
(08/24)
(08/24)
(08/24)
(08/24)
(08/24)
(08/24)
(08/24)


PR

Copyright © インフラ構築手順書 : All rights reserved

TemplateDesign by KARMA7

忍者ブログ [PR]

管理人限定

検索フォーム

カスタム検索

フリーエリア

ESXiの基本設定・運用設定
ESXiのSSH設定
ESXiの NTP設定
VMware ESXiでの時刻同期(NTP)ペストプラクティス
ESXiのゲストOS(仮想マシン)複製
ESXiのOVF形式で複製
異なるESXiバージョン間の複製(移行)
クローン作成後の後処理
仮想マシンのLVM追加
仮想共有ディスクファイルの作成
ESXi上でハイパーバイザーを稼動させる
パフォーマンスがでないとき確認すること


サーバ構築手順
ESXi上でRACを構築する
GFS2+DRBD構築
PaceMaker+MySQLレプリケーション構築
PaceMaker+DRBD構築
HeartBeat2+DRBD構築


Solarisの構築手順
Solarisのネットワーク設定変更
Solarisのホスト名変更
Solaris11のresolv.conf変更手順
Solaris11のHDD増設手順


AWS(Amazon Web Service)の基本設定・運用設定
S3 WEBサイトの構築
S3 WEBサイトのアクセス制限
S3 WEBサイトのリダイレクト設定


Windows Azureの基本設定・運用設定
AzureでWordpress構築
英語版Wordpressを日本語化する
AzureWebサイトの独自ドメイン設定
AzureWebサイトのモード変更
WEBアクセスログ解析ツールの比較


WordPressの基本設定・運用設定
WordPressの基本構造
WordPressのインストール手順
Wordpressマルチサイト機能
「続き読む(more)」カスタマイズ
Wordpressの独自PHP
Wordpressをサブディレクトリに移す
既存サブディレクトリをルートディレクトリとする
Wordpressが利用可能な共用ホスティング


Postfix構築
Postfixにおける暗号化したSMTP認証設定


SoftEtherVPNの構築
ESXi上のSoftEtherVPN構築
DDNSと組み合わせたSoftEtherVPNの設定


LinuxのAD連携
LinuxのActiveDirectory連携について
PAM認証でAD連携
ApacheでAD連携(LDAP認証)
ApacheでAD連携(Kerberos認証)
SAMBAで2台目DCサーバを構築
RedmineとGitのLDAP(AD)認証設定
JenkinsのLDAP(ActiveDirectory)認証設定


Redmine設定
Alminium(RedmineとGit/SVN)のインストール手順
RedmineとGitのLDAP(AD)認証設定
RedmineとGitの移行
JenkinsのLDAP(ActiveDirectory)認証設定


サーバの基本設定・運用設定
Apache
Apacheの基本設定
Apacheの仮想ホスト設定
PHPの基本設定
Nginxのロードバランサ設定
WebDAV構築手順
アンチウィルス
無償アンチウィルス(ClamAV)の導入手順
システム監視
システム監視ソフトMuninの導入手順
システム監視ソフトZabbixの導入手順
sarによるリソース使用情報取得


サーバ移行
Mysqlマイグレーション
MySQLマイグレーション時の問題点と解決策
Windows
Windows OS評価版からの移行
SQL Server評価版からの移行
クラスタソフト
クラスタソフトの比較

ツリーカテゴリ

広告ーSEO





人気ブログランキングへ
にほんブログ村 IT技術ブログ Webサイト構築へ

ブログ王ランキングに参加中!


最新トラックバック

バーコード

アフィリエイト2