Memtest86をかけてみた話
2022/03/19
小江戸らぐ
世良泰明
自己紹介
名前:
世良 泰明 (せら やすあき)
職業:
駆け出しインフラエンジニア (1年目)
名古屋の某SIer所属
経歴:
COBOLバッチ ⇒ webアプリ(java/javascript) ⇒ AWS インフラ構築
趣味:
囲碁, サイクリング, 散歩, etc…
twitter: @y_sera15
今日の話
先週のOSC spring LTにて
きっかけ
ESXi上のVMが謎の挙動
・CentOS Stream9をインストールしようとすると謎のカーネルエラー
・しかも毎回エラー内容が違う
・ごくまれにインストールまではいくものの, 立ち上げたVMが急に落ちる
NUC1 NUC2
ESXi ESXi
CentOS
Stream9
CentOS
Stream9
CentOS
Stream9
こいつの挙動が
おかしい
原因分析
ISOが壊れてる?
⇒ 違う. 2, 3回落とし直したがダメ.
ストレージ(SSD)の問題か?
⇒ 違う. スキャンしてみたが正常.
ネットワーク???
⇒ 違う. LANケーブル変えたが変化なし.
BIOSか…???
⇒ 違う. バージョンを上げたところESXi起動時にクラッシュするように.
もうお手上げ。。。。orz
ということで、相談してみた
2/19(土) サーバー構築ハンズオン いつもの飲み会にて
kabuさん&組長「それ、メモリじゃね?」
⇒memtestをかけてみることに.
memtest86とは
メモリの故障がないか調べるソフト
インフラ屋さんなら
誰もが一度はお世話になったことがあるはず.(受け売り)
画像はwikipediaから
https://en.wikipedia.org/wiki/Memtest86
memtest86
kabuさん&組長「今時のLiveUSBにはmemtest86入ってるよ.」
丁度手元にあったubuntu18.04LTEで試す
⇒memtestが無い!!
丁度手元にあったKaliで試す
⇒ Kaliにはあった. けど動かない!!!(画面移行せず)
memtest86
どうやらUEFIブートなのが原因っぽい。
NUCの設定いじるかー
⇒ BIOSブートが選べない!!!!!
対応メモリを調べられるハードはNUCしか手元にない…
これは, もしかして詰んだ…???
汝よ, 我を救い給え....
UEFIに対応したmemtest86
https://www.memtest86.com/
Passmark社提供のプロプライエタリなソフト
無償版と有償版がある
余談
https://www.memtest.org/
ちなみに, 皆さんがお馴染みなのは(おそらく)こちら
こっちはOSS(GPLライセンス)
改めてmemtestかけた結果…
メモリ, お前だったのか…
より詳細に調べた結果
2枚あるうちの一枚のみ故障.
もう一枚の結果 ⇒
故障したメモリはメーカーに相談(予定)
まとめ
VMの謎の挙動から問題を切り分け、Memtest86にて原因を突き止めた
・メモリのテストを行うツールMemtest86
・UEFIであればpassmark社のmemtest86を使う.
ハード不具合には初めて当たって焦ったが,
memtest86というツールを知れたのは良かった.
早くサポートへ連絡せねば…

Memtest86をかけてみた話