i7-7700KとPrime95最新版の組み合わせは危険

b3g2017-04-09
 i7-7700K CPUにZ270のマザーボードマシンを購入してCentOS 7をインテルのM.2 SSDにインストールするとファイルシステムがおかしくなるトラブルがあったのが先週末。この土日を使ってなんとかならないものかといろいろと試して、一応安定稼働するまでになりましたのでその顛末を。
 CentOS 7はNVMe接続のインテル 600p SSD上のファイルシステムがXFSでインストール後、壊れて使い物になりません。ext4でも同様にエラーとなったように思うのですが今思い返すと確証がないです。

追記

 CentOS 7でext4にしてもエラーとなる現象ですが、再度検証してみました。インストール完了後の再起動時に以下のエラーが出ます。

Welcome to emargency mode! After logging in, type "journalctl -xb" to view
system logs, "systemctl reboot" to reboot, "systemctl default" or ^D to
try again to boot into default mode.
Give root password for maintenance
(or type Control-D to continue):

 これをXFSのときと同じでファイルシステムエラーでダメだと思い込んでいました。実際はもうちょっと調べるとファイルシステムエラーでも/boot/efiのエラーです。該当ファイルシステムはvfatなんですが、これもSSD上に構築するとエラーとなるみたいです。幸いシステム用のSSDとデータ用のHDDを接続していますので、/bootと/boot/efiもHDDに作成して、SSD上にはext4の/とスワップパーティションを作成。残りHDDに/homeをXFSで確保しました。これでインストールしなおすとCentOSでもエラーが出なくなりました。

追記終わり

 Fedora 25でも同様の状況らしいのですが、ext4のみなら大丈夫との報告もあります。そこで今まではCentOS一筋でしたが試しにFedora 25 Serverを導入してみることにしました。
 最初はデフォルトのままXFSでとりあえずインストール。やっぱり再起動後ファイルシステムがおかしくなってこれはダメです。そしてXFSじゃなくext4にしてインストールすると今度は再起動しても問題ありません。しばらくファイルをコピーしたり、再起動を何度もしましたが大丈夫です。
 CentOS7 はXFSに加えてvfatでも問題があったのですが、Fedora 25はvfatをSSD上に作成しても問題ない結果となりました。
 実はもうひとつ問題がありまして、CPUに負荷をかけるツールGIMPSのPrime95を実行していると電源がOFFになったり再起動したりという現象です。システムの安定度を確認するために実行するのですが、実行してすぐに電源OFFとか、1時間ぐらい動いて再起動とか、とにかくダメダメです。ログにも残っておらず、最初はハードウェアの障害を疑ったのですがMemTest86は問題ないんですよね。BIOSの設定をデフォルトにしたり、CPU温度の監視を無効にしても同じです。7700KとKが付いたCPUですが、最初からオーバークロックする意志はなく、定格運転で最高のパフォーマンスということで選んだのにそのパフォーマンスが発揮できないのは選択した意味がありません。
 これは困った。とネットでいろいろと検索するとこちらのページを見つけました。

Make sure to use prime95 V 26.6. Anyhing after that uses a different instruction set and causes unrealistic temperatures.

とのことで、V26.6より新しいバージョンでは使用する命令セットが原因でありえない温度になるそうです。うちでは最新のV28.10を使っていました。そこでこちらのページからV26.6をダウンロードして実行。すると再起動することはなくなりました。もう8時間以上動かしていますが安定しています。
 新しいマシンですが、なかなか手間取りました。新しすぎるのもたいへんですね。

追記

 i7-7700KとPrime95の問題。調べてみると7700Kのtemperature SPIKEとしてPrime95に限らず使っていて突然温度上昇が起こることで結構、話題になっているようです。こちらこちら。うーむ。これはダメですね。i7-7700K CPU、現状ではまったくおすすめできません。

さらに追記

 この問題。ASRockのマザーボードが原因でした。ASUSのものに交換して解決しました