ネットワーク管理者の憂鬱な日常

とある組織でネットワーク管理に携わる管理者の憂鬱な日常を書いてみたりするブログ

FreeBSD Machine Check Architecture

とあるサーバの動きが重いので,なんとなく調べていると,messagesに不穏なログが・・・
と書いていると,以前にも同様のことが.

hoge kernel: MCA: Bank 0, Status 0xcc0000ff20040189
hoge kernel: MCA: Global Cap 0x0000000000180204, Status 0x0000000000000000
hoge kernel: MCA: Vendor "GenuineIntel", ID 0xf49, APIC ID 0
hoge kernel: MCA: CPU 0 COR OVER GCACHE L1 SNOOP error
hoge kernel: MCA: Address 0x31cf780
hoge kernel: MCA: Misc 0x140002c0002a0
hoge kernel: MCA: Bank 1, Status 0x8002088800000135
hoge kernel: MCA: Global Cap 0x0000000000180204, Status 0x0000000000000000
hoge kernel: MCA: Vendor "GenuineIntel", ID 0xf49, APIC ID 0
hoge kernel: MCA: CPU 0 COR DCACHE L1 DRD error
hoge kernel: MCA: Bank 2, Status 0xd100000000000153
hoge kernel: MCA: Global Cap 0x0000000000180204, Status 0x0000000000000000
hoge kernel: MCA: Vendor "GenuineIntel", ID 0xf49, APIC ID 0
hoge kernel: MCA: CPU 0 COR OVER ICACHE LG IRD error


ちなみに,ここで言うMCAは「Machine Check Architecture」.
で,たまたま見ていたサイトでこんな解説を発見.

・2012年5月28日 FreeBSD MCA(Machine Check Architecture)による障害検出 - FreeBSD Daily Topics
http://gihyo.jp/admin/clip/01/fdt/201205/28

で,これによるとUNCORは「UNCORRECTABLE(修復不可能)」らしいので,CORは「CORRECTABLE(修復可能)」だろう.
いずれにせよ,壊れかけの可能性は高いw

ちなみに,kernel stateを見ると,こんな感じ.
# hw.mca.countはちょっと変更しました(苦笑).

% sysctl hw.mca
hw.mca.erratum383: 0
hw.mca.amd10h_L1TP: 1
hw.mca.enabled: 1
hw.mca.count: 9999
hw.mca.interval: 3600
hw.mca.force_scan: 0


こんなの見てると,FreeBSDがハイパーバイザになればいいのに,と思うw

スポンサーリンク