oregano が lost some interrupts at ~HZ というエラーで死亡してた

Google先生にお伺いをたてると VMware で「lost some interrupts at ~HZ」というエラー というページがみつかった。

このページに記載されている /etc/vmware/config ではなく、oregano.vmx の方に

host.useFastClock = FALSE

と書いたところ、一旦このエラーで落ちることはなくなったっぽい。

その代わりに guest OS の時間がめちゃくちゃ狂ってしまうようになったので、仕方なく 1分毎に ntpdate で自宅内ネットワークにある ntp server に問い合わせるようにした。こんな解決方法はマヌケなのはわかっているのだが、一旦仕方なし…。VMware tools 入れるのが正攻法なんだろうけどなぁ。

WD10EACS で RAID5 を増強してみた

元々 320GB の HDT725032VLA360 を 3台と 500GB の HDT725050VLA360 を 1台で 960GB分の RAID5 を組んでいたので、今回はこの RAID5 を WD10EACS 4台で交換することが目的。

RAID に 1TB HDD をスペアとして追加しておき、そこから元の HDD を 1台外して自動的に再構築する、という方法を取った。

まず RAID用パーティションを作る。

# fdisk -l /dev/sdc

Disk /dev/sdc: 1000.2 GB, 1000204886016 bytes
255 heads, 63 sectors/track, 121601 cylinders
Units = シリンダ数 of 16065 * 512 = 8225280 bytes

デバイス Boot Start End Blocks Id System
/dev/sdc1 1 121601 976760001 fd Linux raid 自動検出

そして RAID に追加する。

# mdadm /dev/md2 -a /dev/sdc1
mdadm: added /dev/sdc1
# mdadm -D /dev/md2

/dev/md2:
Version : 00.90.03
Creation Time : Mon May 7 00:53:47 2007
Raid Level : raid5
Array Size : 937705728 (894.27 GiB 960.21 GB)
Device Size : 312568576 (298.09 GiB 320.07 GB)
Raid Devices : 4
Total Devices : 5
Preferred Minor : 2
Persistence : Superblock is persistent

Update Time : Sun Sep 21 16:59:18 2008
State : clean
Active Devices : 4
Working Devices : 5
Failed Devices : 0
Spare Devices : 1

Layout : left-symmetric
Chunk Size : 64K

UUID : 043d09e3:111fad6c:31991985:6939942f
Events : 0.246

Number Major Minor RaidDevice State
0 8 65 0 active sync /dev/sde1
1 8 81 1 active sync /dev/sdf1
2 8 97 2 active sync /dev/sdg1
3 8 113 3 active sync /dev/sdh1

5 8 33 - spare /dev/sdc1

既存の HDD を外して自動リビルドを走らせる。

# mdadm /dev/md2 -f /dev/sdh1
mdadm: set /dev/sdh1 faulty in /dev/md2
# mdadm -D /dev/md2

/dev/md2:
Version : 00.90.03
Creation Time : Mon May 7 00:53:47 2007
Raid Level : raid5
Array Size : 937705728 (894.27 GiB 960.21 GB)
Device Size : 312568576 (298.09 GiB 320.07 GB)
Raid Devices : 4
Total Devices : 5
Preferred Minor : 2
Persistence : Superblock is persistent

Update Time : Sun Sep 21 17:02:21 2008
State : clean, degraded, recovering
Active Devices : 3
Working Devices : 4
Failed Devices : 1
Spare Devices : 1

Layout : left-symmetric
Chunk Size : 64K

Rebuild Status : 0% complete

UUID : 043d09e3:111fad6c:31991985:6939942f
Events : 0.248

Number Major Minor RaidDevice State
0 8 65 0 active sync /dev/sde1
1 8 81 1 active sync /dev/sdf1
2 8 97 2 active sync /dev/sdg1
4 8 49 3 spare rebuilding /dev/sdd1

5 8 113 - faulty spare /dev/sdh1

これを 4台分行なって全て 1TB HDD で構成した RAID5 になった。

このままだと元の RAID サイズのままなので、RAID サイズを拡張させる。

まず、ファイルが壊れないかの検証用に /dev/urandom からファイルを作成し、md5sum で検証できるようにしておく。

# dd if=/dev/urandom of=/storage/dd bs=512 count=10000
10000+0 records in
10000+0 records out
5120000 bytes (5.1 MB) copied, 1.39336 seconds, 3.7 MB/s
# md5sum /storage/dd > ~/md5sum

次に RAID5 のサイズを拡張。

# mdadm --grow /dev/sd2 -z max
# mdadm -D /dev/md2
/dev/md2:
Version : 00.90.03
Creation Time : Mon May 7 00:53:47 2007
Raid Level : raid5
Array Size : 2930279808 (2794.53 GiB 3000.61 GB)
Device Size : 976759936 (931.51 GiB 1000.20 GB)
Raid Devices : 4
Total Devices : 4
Preferred Minor : 2
Persistence : Superblock is persistent

Update Time : Mon Sep 22 11:55:20 2008
State : active, resyncing
Active Devices : 4
Working Devices : 4
Failed Devices : 0
Spare Devices : 0

Layout : left-symmetric
Chunk Size : 64K

Rebuild Status : 32% complete

UUID : 043d09e3:111fad6c:31991985:6939942f
Events : 0.293

Number Major Minor RaidDevice State
0 8 81 0 active sync /dev/sdf1
1 8 65 1 active sync /dev/sde1
2 8 97 2 active sync /dev/sdg1
3 8 113 3 active sync /dev/sdh1

そしてこの RAID5 の上に作られている FileSystem のサイズを拡張する。

# df -h
Filesystem サイズ 使用 残り 使用% マウント位置
/dev/md0 110G 80G 25G 77% /
tmpfs 999M 0 999M 0% /lib/init/rw
udev 10M 104K 9.9M 2% /dev
tmpfs 999M 0 999M 0% /dev/shm
/dev/md2 895G 866G 29G 97% /storage
# xfs_growfs /storage
meta-data=/dev/md2 isize=256 agcount=32, agsize=7325840 blks
= sectsz=4096 attr=0
data = bsize=4096 blocks=234426432, imaxpct=25
= sunit=16 swidth=48 blks, unwritten=1
naming =version 2 bsize=4096
log =internal bsize=4096 blocks=32768, version=2
= sectsz=4096 sunit=1 blks
realtime =none extsz=196608 blocks=0, rtextents=0
data blocks changed from 234426432 to 732569952
# df -h
Filesystem サイズ 使用 残り 使用% マウント位置
/dev/md0 110G 80G 25G 77% /
tmpfs 999M 0 999M 0% /lib/init/rw
udev 10M 104K 9.9M 2% /dev
tmpfs 999M 0 999M 0% /dev/shm
/dev/md2 2.8T 866G 1.9T 31% /storage

最後に md5sum で問題がないか確認する。

# md5sum -c ~/md5sum
/storage/dd: OK

完璧ですね。

WD10EACS を初期化してみた

新規購入した HDD はいつも 0 で初期化するようにしているのだけど、さすがに 1TB もあると恐ろしく時間がかかるね…。結果的に 1台のみで 11.5時間、2台同時で 1台あたり 14時間かかったよ。

実際のコマンドは

dd if=/dev/zero of=/dev/sda

こんな感じ。/dev/zero の代わりに /dev/urandom 使ったら速度が 1/10 になってもっと泣きそうになった。

jasmine の RAID1 が壊れた

毎月第1日曜日恒例の RAID check中に、システムが入っている 120GB x 2 の RAID1 を構成していた HDD で READ Error が出てしまった模様。おかげで RAID1 がデグレーテッドしてしまった。

替えの HDD を用意していなかったので若干困ったのだけど、READ Error の内容は DMA転送に失敗したとかそういう感じだったので、再起動して再度 RAID1 構成に加えてみたら問題なく再構築できたので、一旦このまま様子見。

このままだとさすがに恐いので、いま RAID5 を組んでいる 320GB x 4 を 1TB x 4 にして、残った 320GB で RAID1 を組み直そうかと考え中。320GB x 4 の RAID5 が予想以上に速いペースで埋まってしまったので、3TB分のストレージがあってもいいかな、って(笑)。

EeePC 901 に TrueCrypt をインストールしてみた

TrueCrypt

USBメモリのために使ってみた。偽装した暗号化ドライブを作れるのがすごくいいね。

ってわけで思わず日本の名字ランキング 2,000位までと 1981年からの名前ランキング 100位/年 を適当に組み合わせ、さらに現在使われていない 03-[012789]\d{3},\d{4} をランダムで生成して 20,000件分の個人情報ぽいデータを作る ruby script 作っちゃった。このデータを暗号化した zip に入れて偽装領域に(笑)。

oregano の cacti が直った

未来に飛んだの 7時間分を消化したら、ちゃんと cacti がグラフを作るようになった。良かった良かった。

ただ VMware で動かすとやはりクロックの関係で時間が狂いまくる…。nagios で ntpd の時間がずれてないのか監視しているのだけど、監視サーバー自体の時間がずれるからエラーメールがバンバン届いて困った。vmware-tools って Debian だとどうやってインストールするのがいいのかなー。

oregano を VMware Server の VM にしてみた

自宅ネットワークの監視サーバーとして稼働していた oregano の RAID1構成にしていた HDD が壊れてしまった。15GB の 2.5inch HDD なんていまさら手に入らないし、監視するだけなので別に独立した 1台で稼働させる必要もないってことで、VMware Server で動かすことにした。

作業は簡単で

  1. VMware Server 上で新oregano の VM を作る。
  2. Debian Installer を起動して HDD を認識させるところまで進める。
  3. 仮想HDD のパーティションを適当に作る。システムID は 0xfd で。
  4. 仮想HDD のパーティションで適当にファイルシステムやスワップを作る。
  5. oregano の HDD を取り出して USB変換アダプタで USB として繋ぐ。
  6. Debian Installer を起動している VM に USB をアタッチする。
  7. それぞれのパーティションを mount する。
  8. 旧から新に cp -a とかしてコピーする←cpioとかの方がいいんだろうけど、使い方知らない…。
  9. Debian Installer 終了。
  10. GRUB FD あたりで新パーティションから起動させる。
  11. # grub-install /dev/hda
  12. もう 1つ仮想 HDD を作り、RAID1 を再構築

って感じ。

それぞれの細かい方法は各自検索してください←めんどくさい(笑)。

RAID1 組んでるマシン上の VMware でさらに RAID1 を組むのは冗長でしかないんだけど、なんとなく趣味でこうしてみた。

ただシステム時間がうまく合わなかったみたいで、一旦 7時間ほど未来に飛んでしまった模様。おかげで cacti のグラフがうまく作られない…。

VMware Server 2.0 RC2 を入れてみた

いままで使っていたのは VMware Server 1.0.2 とかって結構古いのだったので、思い切って 2.0 RC2 にしてみた。

インストール方法は VMware Server 1.0.x の頃と同じで、

# alien -d -c ~/VMware-server-2.0.0-110949.i386.rpm
# dpkg -i vmware-server_2.0.0-110949_i386.deb

って感じでおけー。

その後も設定も

# vmware-config.pl

で適当に return 押していればあっさりと終了。

念の為 VMware Server 1.0.x のときに入ったファイルを全部削除してから作業したのだけど、もしかしたら上書きインストールでもうまくいったのかも。

しかし 2.0 になって VMware Server の client がなくなったのはすごく大きいね。https://hogehoge:8333/ って URL でアクセスすると、VMware Server の設定画面が出てくる。さらにそこから console を開こうとすると VMware Player みたいなウィンドウで VM の画面を client に出力できるようになる。

1.0.x では client が Windows か Linux じゃないとダメだったのもあって VM の電源オンや設定変更するのも OS が限られていたけど、これなら MacOS X なんかでも console 開く以外は可能になったのがとてもいい感じ。とはいえ MacOS X Leopard の Firefox 3.0.1 からだと、なぜかうまくログインできなかったんだけど…(^^;。

EeePC 901 に VMware Player を入れてみた

特に問題なし。

VMX Builder も入れてみたけど、起動時に tabctl32.ocx がないとか言われた。VB6 のランタイムがなくて困ったとか相当久しぶりなんだけど…。で、tabctl32.ocx を用意したら起動したにはしたけど、縦600 の解像度しかない EeePC 901 だと、ダイアログがはみだしてまともに使えない罠。1024×768 にしたらなんとか使えたからいいんだけど。

で、実際に生成した .vmx を見ると、必要のない項目がたくさん書かれちゃっててちょっとうーん…。これならライセンス切れた Workstation でも .vmx の設定変更はできるっていう裏技を使う方がいいかもしれない。私の場合、VMware Fusion で作った .vmx のうち、virtualHW.version = “6″ に変更して動かすのが一番ラクそう。