Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Today is special in mylife,
and Kernel/VM ....
2014年7月12日 Kernel/VM北陸 1
@sushi514
Kernel/VM探検隊@北陸 12014年7月12日 Kernel/VM北陸 2
小話:そしてGPUベイカーへと…
RADEON HD6850との出会い
加熱処理を用いた故障GPUの再生実験
67台の故障GPUでの定量的評価
ベイクドGPU
デモ
ベイカーの未来
ネットワーク焼く?メモリ焼く?
2014年7月...
事案発生
2012年7月3日
RADEON HD6850ちゃんが100℃超えて死ぬ
ベンチが通らない
ゲームもできない(´・ω・`)
焼いてみた
ヒートガンでやる?オーブントースターでやる?
電子レンジのオーブン機能:210℃ 3...
2014年7月12日 Kernel/VM北陸 5
衝撃の展開
参考文献2
オーブンの効能
•焼く前
• 温度:100℃超
• 音 :騒音
• ベンチマーク:
保護回路働いて死
•ベイクド
• 温度:70℃
• 音 :静音
• ベンチマーク
FF XIV 3315
2014年7月12日 Kernel/VM北陸 6
2014年7月12日 Kernel/VM北陸 7
( ˘⊖˘) 。o(でもなんで
2014年7月12日 Kernel/VM北陸 8
( ˘⊖˘) 。o(でもなんで新しいGPUが
壊れるんだ… )
2014年7月12日 Kernel/VM北陸 9
( ˘⊖˘) 。o(でもなんで新しいGPUが
壊れるんだ… )
AF6850-1024D5S1の発売時期
2011年3月頃
(購入は2012年頭)
参考文献3
2014年7月12日 Kernel/VM北陸 10
|| ┗(☋` )┓三 ちょっと調べてみよう
自らの修理歴を振り返る
2014年7月12日 Kernel/VM北陸 11
故障の考察
2014年7月12日 Kernel/VM北陸 12
尋常じゃないGPUたち
短期間で故障
負荷をかけると異常発熱して強制終了
ドライバがあたらない
故障原因の検討
冷却不足(対策するも効果なし)
各部品の故障なのか
2014年7月12日 Kernel/VM北陸 13
発売・購入から1...
そしてGPUベイカーへと…
加熱処理が有効な修理方法なら
修理のノウハウがまたひとつ増える!✌('ω'
転売で一攫千金も夢じゃない!✌('ω'✌ )三✌('ω')✌三( ✌'ω')✌
GPU焼くのは楽しい
よくわからないワクワク感と物...
加熱処理を用いた
故障したGPUの再生実験
理論編だったり実践編だったり。
2014年7月12日 Kernel/VM北陸 15
GPU
モダンなお小遣い稼ぎアクセラレータ
すごい
集積度の向上
• 年1.7倍
電力効率
• スパコン利用
コア数
• K40 コア2880個(トランジスタ数71億)
すごいすごい… 2014年7月12日 Kernel/VM北陸 ...
GPUの駆動時の温度
アイドル
40℃
高負荷時
80℃や90℃に
2014年7月12日 Kernel/VM北陸 17
0
40
50
60
70
80
90
100
105
保護機能で強制停止
高負荷時
アイドル
温度は寿命に直結します
2014年7月12日 Kernel/VM北陸 18
GPU上にある各パーツ
受動素子
抵抗,コイル,コンデンサ, VRM
能動素子
LSI,制御用IC
コンデンサ
よく死ぬ
2014年7月12日 Kernel/VM北陸 19
参考文献8
パーツの寿命
•寿命イメージ
• コンデンサ
• コイル
• 抵抗
• VRM
• DRAM
• 制御用IC
•コンデンサ
• アルミニウム
電解コンデンサ
(液体コンデンサ)
• アルミ
固体電解コンデンサ
(固体コンデンサ)
2014年7月...
アルミニウム電解コンデンサ
2014年7月12日 Kernel/VM北陸 21
アルミ固体電解コンデンサ
2014年7月12日 Kernel/VM北陸 22
コンデンサ比較
•設計寿命
• 85℃/2000時間
(85℃品)
•設計寿命
• 105℃/2000時間
(105℃品)
2014年7月12日 Kernel/VM北陸 23
実使用時間の設計
アレニウス則
使用温度が10℃下がるごとに寿命が2倍
例:85℃品のコンデンサ
85℃ 2000時間 ≒ 83日
75℃ 4000時間 ≒ 166日
65℃ 8000時間 ≒ 333日
105℃品で75℃でも160...
はんだ面に着目
LSIのはんだ
BGA実装
• 昨今では狭ピッチでのFBGA等
Pbフリーはんだの登場
• 融点が高い、一定でないといった性質
2014年7月12日 Kernel/VM北陸 25
BGAの不具合事例
加熱不足
はんだボール未融合
BGAパッケージ/プリント配線基板の反り
はんだボール表面の酸化膜
 フラックスの活性力低下
はんだ接合部剥離(ボール落ち)
2014年7月12日 Kernel/VM北陸 26
参考...
Pbフリーはんだの弱点
熱疲労に弱い
GPUの熱サイクルももちろんダメージとなる
機械的に弱い
鉛はんだに比べて硬いので
境界面でクラックが生じやすい性質
融点が一定でない
金属化合物を生成し、小さな歪みで破断する
2014年7月1...
熱サイクル試験
はんだの切断評価と解析
2014年7月12日 Kernel/VM北陸 28
参考文献10
Pbフリーのはんだの再溶融
リフローとは
BGAの実装で利用
• ①はんだ印刷
• ②部品実装
• ③加熱
• ④冷却
両面実装時には
フローも行う
再溶融問題
2014年7月12日 Kernel/VM北陸 29
参考文献11、12、13
多くの問題が
あるようです
2014年7月12日 Kernel/VM北陸 30
∧_∧
∧_∧ (´<_` ) ちょっとそのまとめ方雑じゃないか
( ´_ゝ`) / ⌒i
/ \ | |
/ / ̄ ̄ ̄ ̄/ |
__(__ニつ/ / .| .|_...
さて
2014年7月12日 Kernel/VM北陸 31
皆さんは知っていますね?
高温で動作するLSIの乗った不具合機
2014年7月12日 Kernel/VM北陸 32
皆さんは知っていますね?
高温で動作するLSIの乗った不具合機
2014年7月12日 Kernel/VM北陸 33
皆さんは知っていますね?
高温で動作するLSIの乗った不具合機
2014年7月12日 Kernel/VM北陸 34
YLoD
Yellow Light Of Death
電源ランプが点滅して動かなくなる
2006年にPS3が登場してまもなく颯爽☆登場
ユーザの対処
ヒートガンで炙る(そこそこ直る)
2014年7月12日 Kernel/VM北陸 35...
SONYの涙の対応
2014年7月12日 Kernel/VM北陸 36
参考文献16
2014年7月12日 Kernel/VM北陸 37
RROD
Red Ring of Death
ハードウェアのランプが赤く3つ点灯して起動せず
2005年に発売して多くの報告
(3台に1台は死んでる
海外での異例の保証延長
キチガイ療法
 towel trick
2014年7月12...
Towel Trick
熱暴走を誘発
こ れ は キ チ ガ イ
2014年7月12日 Kernel/VM北陸 39
このLSIの再生プロセスを仮定
関連事例共通の仮説
発熱の大きいLSIのはんだクラックの可能性
加熱処理により再溶融させはんだを再溶融し結合
2014年7月12日 Kernel/VM北陸 40
GPUも同じ症状で起きていると仮定
故障した...
2014年7月12日 Kernel/VM北陸 41
GPUの加熱実験
•実験の目的
故障したGPUを加熱することで
修理が可能なのか
•
対象となるGPU
– はんだクラックが起きていると思われるGPU
2014年7月12日 Kernel/VM北陸 42
加熱器具と加熱条件
●ヒートガン
●ドライヤー
●オーブン
●210℃
●3分
●30分
2014年7月12日 Kernel/VM北陸 43
加熱器具
●オーブンレンジ
– 同条件で加熱することが容易
– 均一にLSIを温められる
2014年7月12日 Kernel/VM北陸 44
加熱のさじ加減
●リフローのピーク温度
– 230℃以上
●Pbフリーはんだ融点
– 216℃〜220℃
この加熱実験では全てのはんだを
溶かしきりたいわけではない
2014年7月12日 Kernel/VM北陸 45
210℃ 3分
●これまでのレシピ
– はんだクラックだけを溶かすこと狙ってい
る
●ヒートスプレッダ付きGPU
– LSIの加熱の障害
– 210℃ 4分に設定
2014年7月12日 Kernel/VM北陸 46
負荷テスト
● 再生したGPU
– 本当に計算能力があるかわからない
– 負荷をかけると強制終了するかもしれない
● 負荷テストを実施
– ベンチマークソフトSandraや3DMarkを利用
...
2014年7月12日 Kernel/VM北陸 47
使用機材・加熱環境
●オーブン機能付き
電子レンジ
– National NE-N25
– 製造年1996年
– 1.40KW(電熱時)
2014年7月12日 Kernel/VM北陸 48
使用機材・加熱環境
● 温度計
– SEKISUI 室温
(-30℃ - 50℃)
自然冷却時計測
– EMPEX 室温
(-20℃ - 50℃)
ベンチマーク時計測
– GPU-Z GPU温...
2014年7月12日 Kernel/VM北陸 49
使用機材・負荷環境
● 使用したPC
CPU Core i7 2.8GHz
RAM 4GB
Storage 32GB SSD
• OS Windows7 64bit
● ディスプレイ
Disp...
2014年7月12日 Kernel/VM北陸 50
使用機材・ベンチマーク
● Sandra
– ライト版 2013.10.19.66
– グラフィックレンダリング テストを実施
● 3D Mark06
– BasicEdition 1.2.0...
2014年7月12日 Kernel/VM北陸 51
実験手順1
•実験対象となるGPUの
ヒートシンクやファンを取り外し
グリスを拭き取る
2014年7月12日 Kernel/VM北陸 52
実験手順2
•オーブン内を210℃まで余熱する
2014年7月12日 Kernel/VM北陸 53
実験手順3
•オーブンの天板にGPUを載せ
210℃で3分加熱する
2014年7月12日 Kernel/VM北陸 54
実験手順3
•オーブンの天板にGPUを載せ
210℃で3分加熱する
2014年7月12日 Kernel/VM北陸 55
実験手順4
•オーブンから取り出し自然冷却を行い
GPUを組み立て,PCに取り付ける
2014年7月12日 Kernel/VM北陸 56
実験手順5
•GPUの動作テストを行う
2014年7月12日 Kernel/VM北陸 57
実験手順6
•正常な画面描画が可能なGPUに対して
メーカのドライバをインストールし
ベンチマークで負荷をかける
2014年7月12日 Kernel/VM北陸 58
予備実験
●加熱実験のテスト
– 画面の映らなくなったRadeon 6850HD
●負荷テストのテスト
– 正常に動作するGeForce 9800GT
2014年7月12日 Kernel/VM北陸 59
加熱実験のテスト
• Radeon 6800HD
– 画面が出ないことを確認
210℃で3分加熱処理
2014年7月12日 Kernel/VM北陸 60
テストの結果
●画面の描画が再び行われた
– 正常に動作した
●再起動を行った後,症状が再現
– 画面は出力されなくなった
このGPUは再生しなかった
2014年7月12日 Kernel/VM北陸 61
負荷テストの結果
• GeForce 9800GT
● Sandra
– 浮動小数点スコア
225.63 (MPixel/s)
– ダブルシェーダDXスコア
33.12 (MPixel/s)
...
さて
2014年7月12日 Kernel/VM北陸 62
2014年7月12日 Kernel/VM北陸 63
実験素材の準備
●67台の故障したGPUを収集した
2014年7月12日 Kernel/VM北陸 64
加熱対象の選定
●67台のGPUで負荷テスト
– 加熱処理において修理可能なGPUを選別
●加熱処理の必要がないものを除去
– コンデンサや抵抗がは存しているGPU
– 正常にベンチマークを通...
2014年7月12日 Kernel/VM北陸 65
故障の症状で分別
2014年7月12日 Kernel/VM北陸 66
メーカ・機種別で分別
加熱実験を行う
2014年7月12日 Kernel/VM北陸 67
加熱実験しました
2014年7月12日 Kernel/VM北陸 68
症状別での実験結果
2014年7月12日 Kernel/VM北陸 69
メーカ・世代ごとでの結果
●NVIDIA
2014年7月12日 Kernel/VM北陸 70
メーカ・世代ごとでの結果
●AMD
2014年7月12日 Kernel/VM北陸 71
結果の考察
•41台のGPUをオーブンで加熱処理した
–変化があったものが16台
–このうち再生したものは8台
•再生可能性が高いGPU
–画面が描画があるものは可能性が高い
–世代が新しいG...
2014年7月12日 Kernel/VM北陸 72
まとめ
実験の目的
故障したGPUを加熱することで
修理が可能なのか
加熱処理による再生は有効だった
デモ
動画を何点か
つくもさんの完璧動作した(´・ω・`)
焼いた→ddddddddddddddd
焼いた→直った
2014年7月12日 Kernel/VM北陸 73
ベイカーの未来
ネットワーク?
• 今進化が熱い
メモリ?
• ホットストレージ、あるいみホット
ベイクドメモリーでいきます
2014年7月12日 Kernel/VM北陸 74
小話:そしてGPUベイカーへと…
RADEON HD6850との出会い
加熱処理を用いた故障GPUの再生実験
67台の故障GPUでの定量的評価
ベイクドGPU
デモで動画を何本か
ベイカーの未来
メモリ焼く!
2014年7月12...
1.オーブントースターのリフロー装置 --個人サイト
http://www.ne.jp/asahi/jh1htq/machida/kousaku/reflow/reflow.html
2.Twilog 2012年07月03日(火)
http:/...
2014年7月12日 Kernel/VM北陸 77
8.信頼性試験(コンデンサの劣化評価・寿命予測)Panasonic解析センター
http://www2.panasonic.co.jp/aec/reliability/electronic.h...
2014年7月12日 Kernel/VM北陸 78
15.Youtube検索 [PS3 YLoD fix ] 34,900件
https://www.youtube.com/results?search_query=PS3+YLoD++fix
...
Upcoming SlideShare
Loading in …5
×

ベイクドGPU Kernel/VM北陸1

9,437 views

Published on

プレゼン冒頭のアニメーションより
「前回は@naota334 の声掛け事案により、
15分のLTに挑戦した、すし。
BeepなDTMを終え、一時の安息を享受していた

なんとなしにうpしたスライドをきっかけに、
@syuu1228の粋な計らいによって、
今回、この金沢で話すことになった。

45分枠。用意された「ベイクドGPU」というタイトル。
この(無茶な)期待にこたえるべく、
全ての知識とベイカーの未来を今語る…」

  • Be the first to comment

ベイクドGPU Kernel/VM北陸1

  1. 1. Today is special in mylife, and Kernel/VM .... 2014年7月12日 Kernel/VM北陸 1
  2. 2. @sushi514 Kernel/VM探検隊@北陸 12014年7月12日 Kernel/VM北陸 2
  3. 3. 小話:そしてGPUベイカーへと… RADEON HD6850との出会い 加熱処理を用いた故障GPUの再生実験 67台の故障GPUでの定量的評価 ベイクドGPU デモ ベイカーの未来 ネットワーク焼く?メモリ焼く? 2014年7月12日 Kernel/VM北陸 3
  4. 4. 事案発生 2012年7月3日 RADEON HD6850ちゃんが100℃超えて死ぬ ベンチが通らない ゲームもできない(´・ω・`) 焼いてみた ヒートガンでやる?オーブントースターでやる? 電子レンジのオーブン機能:210℃ 3分 2014年7月12日 Kernel/VM北陸 4 参考文献1
  5. 5. 2014年7月12日 Kernel/VM北陸 5 衝撃の展開 参考文献2
  6. 6. オーブンの効能 •焼く前 • 温度:100℃超 • 音 :騒音 • ベンチマーク: 保護回路働いて死 •ベイクド • 温度:70℃ • 音 :静音 • ベンチマーク FF XIV 3315 2014年7月12日 Kernel/VM北陸 6
  7. 7. 2014年7月12日 Kernel/VM北陸 7 ( ˘⊖˘) 。o(でもなんで
  8. 8. 2014年7月12日 Kernel/VM北陸 8 ( ˘⊖˘) 。o(でもなんで新しいGPUが 壊れるんだ… )
  9. 9. 2014年7月12日 Kernel/VM北陸 9 ( ˘⊖˘) 。o(でもなんで新しいGPUが 壊れるんだ… ) AF6850-1024D5S1の発売時期 2011年3月頃 (購入は2012年頭) 参考文献3
  10. 10. 2014年7月12日 Kernel/VM北陸 10 || ┗(☋` )┓三 ちょっと調べてみよう
  11. 11. 自らの修理歴を振り返る 2014年7月12日 Kernel/VM北陸 11
  12. 12. 故障の考察 2014年7月12日 Kernel/VM北陸 12
  13. 13. 尋常じゃないGPUたち 短期間で故障 負荷をかけると異常発熱して強制終了 ドライバがあたらない 故障原因の検討 冷却不足(対策するも効果なし) 各部品の故障なのか 2014年7月12日 Kernel/VM北陸 13 発売・購入から1年たっておらず 各部品に寿命がきたとは考えにくい
  14. 14. そしてGPUベイカーへと… 加熱処理が有効な修理方法なら 修理のノウハウがまたひとつ増える!✌('ω' 転売で一攫千金も夢じゃない!✌('ω'✌ )三✌('ω')✌三( ✌'ω')✌ GPU焼くのは楽しい よくわからないワクワク感と物理修理ガチャ感 2014年7月12日 Kernel/VM北陸 14
  15. 15. 加熱処理を用いた 故障したGPUの再生実験 理論編だったり実践編だったり。 2014年7月12日 Kernel/VM北陸 15
  16. 16. GPU モダンなお小遣い稼ぎアクセラレータ すごい 集積度の向上 • 年1.7倍 電力効率 • スパコン利用 コア数 • K40 コア2880個(トランジスタ数71億) すごいすごい… 2014年7月12日 Kernel/VM北陸 16 ( ´∀ `)<モナー 参考文献4,5,6,7
  17. 17. GPUの駆動時の温度 アイドル 40℃ 高負荷時 80℃や90℃に 2014年7月12日 Kernel/VM北陸 17 0 40 50 60 70 80 90 100 105 保護機能で強制停止 高負荷時 アイドル
  18. 18. 温度は寿命に直結します 2014年7月12日 Kernel/VM北陸 18
  19. 19. GPU上にある各パーツ 受動素子 抵抗,コイル,コンデンサ, VRM 能動素子 LSI,制御用IC コンデンサ よく死ぬ 2014年7月12日 Kernel/VM北陸 19 参考文献8
  20. 20. パーツの寿命 •寿命イメージ • コンデンサ • コイル • 抵抗 • VRM • DRAM • 制御用IC •コンデンサ • アルミニウム 電解コンデンサ (液体コンデンサ) • アルミ 固体電解コンデンサ (固体コンデンサ) 2014年7月12日 Kernel/VM北陸 20
  21. 21. アルミニウム電解コンデンサ 2014年7月12日 Kernel/VM北陸 21
  22. 22. アルミ固体電解コンデンサ 2014年7月12日 Kernel/VM北陸 22
  23. 23. コンデンサ比較 •設計寿命 • 85℃/2000時間 (85℃品) •設計寿命 • 105℃/2000時間 (105℃品) 2014年7月12日 Kernel/VM北陸 23
  24. 24. 実使用時間の設計 アレニウス則 使用温度が10℃下がるごとに寿命が2倍 例:85℃品のコンデンサ 85℃ 2000時間 ≒ 83日 75℃ 4000時間 ≒ 166日 65℃ 8000時間 ≒ 333日 105℃品で75℃でも16000時間、666日以上 • 1年以上の動作可能な設計 2014年7月12日 Kernel/VM北陸 24
  25. 25. はんだ面に着目 LSIのはんだ BGA実装 • 昨今では狭ピッチでのFBGA等 Pbフリーはんだの登場 • 融点が高い、一定でないといった性質 2014年7月12日 Kernel/VM北陸 25
  26. 26. BGAの不具合事例 加熱不足 はんだボール未融合 BGAパッケージ/プリント配線基板の反り はんだボール表面の酸化膜  フラックスの活性力低下 はんだ接合部剥離(ボール落ち) 2014年7月12日 Kernel/VM北陸 26 参考文献8
  27. 27. Pbフリーはんだの弱点 熱疲労に弱い GPUの熱サイクルももちろんダメージとなる 機械的に弱い 鉛はんだに比べて硬いので 境界面でクラックが生じやすい性質 融点が一定でない 金属化合物を生成し、小さな歪みで破断する 2014年7月12日 Kernel/VM北陸 27 参考文献9
  28. 28. 熱サイクル試験 はんだの切断評価と解析 2014年7月12日 Kernel/VM北陸 28 参考文献10
  29. 29. Pbフリーのはんだの再溶融 リフローとは BGAの実装で利用 • ①はんだ印刷 • ②部品実装 • ③加熱 • ④冷却 両面実装時には フローも行う 再溶融問題 2014年7月12日 Kernel/VM北陸 29 参考文献11、12、13
  30. 30. 多くの問題が あるようです 2014年7月12日 Kernel/VM北陸 30 ∧_∧ ∧_∧ (´<_` ) ちょっとそのまとめ方雑じゃないか ( ´_ゝ`) / ⌒i / \ | | / / ̄ ̄ ̄ ̄/ | __(__ニつ/ / .| .|____ \/____/ (u ⊃
  31. 31. さて 2014年7月12日 Kernel/VM北陸 31
  32. 32. 皆さんは知っていますね? 高温で動作するLSIの乗った不具合機 2014年7月12日 Kernel/VM北陸 32
  33. 33. 皆さんは知っていますね? 高温で動作するLSIの乗った不具合機 2014年7月12日 Kernel/VM北陸 33
  34. 34. 皆さんは知っていますね? 高温で動作するLSIの乗った不具合機 2014年7月12日 Kernel/VM北陸 34
  35. 35. YLoD Yellow Light Of Death 電源ランプが点滅して動かなくなる 2006年にPS3が登場してまもなく颯爽☆登場 ユーザの対処 ヒートガンで炙る(そこそこ直る) 2014年7月12日 Kernel/VM北陸 35 参考文献15
  36. 36. SONYの涙の対応 2014年7月12日 Kernel/VM北陸 36 参考文献16
  37. 37. 2014年7月12日 Kernel/VM北陸 37
  38. 38. RROD Red Ring of Death ハードウェアのランプが赤く3つ点灯して起動せず 2005年に発売して多くの報告 (3台に1台は死んでる 海外での異例の保証延長 キチガイ療法  towel trick 2014年7月12日 Kernel/VM北陸 38 参考文献17,18
  39. 39. Towel Trick 熱暴走を誘発 こ れ は キ チ ガ イ 2014年7月12日 Kernel/VM北陸 39
  40. 40. このLSIの再生プロセスを仮定 関連事例共通の仮説 発熱の大きいLSIのはんだクラックの可能性 加熱処理により再溶融させはんだを再溶融し結合 2014年7月12日 Kernel/VM北陸 40 GPUも同じ症状で起きていると仮定 故障したGPUは加熱処理により修理可能
  41. 41. 2014年7月12日 Kernel/VM北陸 41 GPUの加熱実験 •実験の目的 故障したGPUを加熱することで 修理が可能なのか • 対象となるGPU – はんだクラックが起きていると思われるGPU
  42. 42. 2014年7月12日 Kernel/VM北陸 42 加熱器具と加熱条件 ●ヒートガン ●ドライヤー ●オーブン ●210℃ ●3分 ●30分
  43. 43. 2014年7月12日 Kernel/VM北陸 43 加熱器具 ●オーブンレンジ – 同条件で加熱することが容易 – 均一にLSIを温められる
  44. 44. 2014年7月12日 Kernel/VM北陸 44 加熱のさじ加減 ●リフローのピーク温度 – 230℃以上 ●Pbフリーはんだ融点 – 216℃〜220℃ この加熱実験では全てのはんだを 溶かしきりたいわけではない
  45. 45. 2014年7月12日 Kernel/VM北陸 45 210℃ 3分 ●これまでのレシピ – はんだクラックだけを溶かすこと狙ってい る ●ヒートスプレッダ付きGPU – LSIの加熱の障害 – 210℃ 4分に設定
  46. 46. 2014年7月12日 Kernel/VM北陸 46 負荷テスト ● 再生したGPU – 本当に計算能力があるかわからない – 負荷をかけると強制終了するかもしれない ● 負荷テストを実施 – ベンチマークソフトSandraや3DMarkを利用 負荷テストをクリアして再生とみなす
  47. 47. 2014年7月12日 Kernel/VM北陸 47 使用機材・加熱環境 ●オーブン機能付き 電子レンジ – National NE-N25 – 製造年1996年 – 1.40KW(電熱時)
  48. 48. 2014年7月12日 Kernel/VM北陸 48 使用機材・加熱環境 ● 温度計 – SEKISUI 室温 (-30℃ - 50℃) 自然冷却時計測 – EMPEX 室温 (-20℃ - 50℃) ベンチマーク時計測 – GPU-Z GPU温度 ソフトウェア負荷テスト用
  49. 49. 2014年7月12日 Kernel/VM北陸 49 使用機材・負荷環境 ● 使用したPC CPU Core i7 2.8GHz RAM 4GB Storage 32GB SSD • OS Windows7 64bit ● ディスプレイ Display 1 (VGA) & IO-DATA 17inch SXGA(1280x1024) ● Display 2 (DVI) & IO-DATA 19inch WXGA+(1440x900)
  50. 50. 2014年7月12日 Kernel/VM北陸 50 使用機材・ベンチマーク ● Sandra – ライト版 2013.10.19.66 – グラフィックレンダリング テストを実施 ● 3D Mark06 – BasicEdition 1.2.0 – フルテストを実施(20分程度の計測) ● ディスプレイ Display 1 (VGA) & IO-DATA 17inch SXGA(1280x1024) Display 2 (DVI) & IO-DATA 19inch WXGA+(1440x900)
  51. 51. 2014年7月12日 Kernel/VM北陸 51 実験手順1 •実験対象となるGPUの ヒートシンクやファンを取り外し グリスを拭き取る
  52. 52. 2014年7月12日 Kernel/VM北陸 52 実験手順2 •オーブン内を210℃まで余熱する
  53. 53. 2014年7月12日 Kernel/VM北陸 53 実験手順3 •オーブンの天板にGPUを載せ 210℃で3分加熱する
  54. 54. 2014年7月12日 Kernel/VM北陸 54 実験手順3 •オーブンの天板にGPUを載せ 210℃で3分加熱する
  55. 55. 2014年7月12日 Kernel/VM北陸 55 実験手順4 •オーブンから取り出し自然冷却を行い GPUを組み立て,PCに取り付ける
  56. 56. 2014年7月12日 Kernel/VM北陸 56 実験手順5 •GPUの動作テストを行う
  57. 57. 2014年7月12日 Kernel/VM北陸 57 実験手順6 •正常な画面描画が可能なGPUに対して メーカのドライバをインストールし ベンチマークで負荷をかける
  58. 58. 2014年7月12日 Kernel/VM北陸 58 予備実験 ●加熱実験のテスト – 画面の映らなくなったRadeon 6850HD ●負荷テストのテスト – 正常に動作するGeForce 9800GT
  59. 59. 2014年7月12日 Kernel/VM北陸 59 加熱実験のテスト • Radeon 6800HD – 画面が出ないことを確認 210℃で3分加熱処理
  60. 60. 2014年7月12日 Kernel/VM北陸 60 テストの結果 ●画面の描画が再び行われた – 正常に動作した ●再起動を行った後,症状が再現 – 画面は出力されなくなった このGPUは再生しなかった
  61. 61. 2014年7月12日 Kernel/VM北陸 61 負荷テストの結果 • GeForce 9800GT ● Sandra – 浮動小数点スコア 225.63 (MPixel/s) – ダブルシェーダDXスコア 33.12 (MPixel/s) ● 3DMarkスコア – 10826
  62. 62. さて 2014年7月12日 Kernel/VM北陸 62
  63. 63. 2014年7月12日 Kernel/VM北陸 63 実験素材の準備 ●67台の故障したGPUを収集した
  64. 64. 2014年7月12日 Kernel/VM北陸 64 加熱対象の選定 ●67台のGPUで負荷テスト – 加熱処理において修理可能なGPUを選別 ●加熱処理の必要がないものを除去 – コンデンサや抵抗がは存しているGPU – 正常にベンチマークを通過したGPU 41台の修理可能なGPUを選別 28台が該当
  65. 65. 2014年7月12日 Kernel/VM北陸 65 故障の症状で分別
  66. 66. 2014年7月12日 Kernel/VM北陸 66 メーカ・機種別で分別 加熱実験を行う
  67. 67. 2014年7月12日 Kernel/VM北陸 67 加熱実験しました
  68. 68. 2014年7月12日 Kernel/VM北陸 68 症状別での実験結果
  69. 69. 2014年7月12日 Kernel/VM北陸 69 メーカ・世代ごとでの結果 ●NVIDIA
  70. 70. 2014年7月12日 Kernel/VM北陸 70 メーカ・世代ごとでの結果 ●AMD
  71. 71. 2014年7月12日 Kernel/VM北陸 71 結果の考察 •41台のGPUをオーブンで加熱処理した –変化があったものが16台 –このうち再生したものは8台 •再生可能性が高いGPU –画面が描画があるものは可能性が高い –世代が新しいGPUほど効果が高い 加熱処理による再生は有効だった
  72. 72. 2014年7月12日 Kernel/VM北陸 72 まとめ 実験の目的 故障したGPUを加熱することで 修理が可能なのか 加熱処理による再生は有効だった
  73. 73. デモ 動画を何点か つくもさんの完璧動作した(´・ω・`) 焼いた→ddddddddddddddd 焼いた→直った 2014年7月12日 Kernel/VM北陸 73
  74. 74. ベイカーの未来 ネットワーク? • 今進化が熱い メモリ? • ホットストレージ、あるいみホット ベイクドメモリーでいきます 2014年7月12日 Kernel/VM北陸 74
  75. 75. 小話:そしてGPUベイカーへと… RADEON HD6850との出会い 加熱処理を用いた故障GPUの再生実験 67台の故障GPUでの定量的評価 ベイクドGPU デモで動画を何本か ベイカーの未来 メモリ焼く! 2014年7月12日 Kernel/VM北陸 75
  76. 76. 1.オーブントースターのリフロー装置 --個人サイト http://www.ne.jp/asahi/jh1htq/machida/kousaku/reflow/reflow.html 2.Twilog 2012年07月03日(火) http://twilog.org/sushi514/date-120703 3.AFOX「AF6850-1024D5S1」補助電源コネクタなしの 1スロ版「Radeon HD 6850」が発売 – @asciijpeditors http://ascii.jp/elem/000/000/595/595317/ 4.Monacoin http://monacoin.org/ja/ 5.GPU technology trends and future requirements J.Y. Chen “GPU Technology Trends and Future Requirements,” Proc. International Electron Devices Meeting, Dec. 2009. 6.The Green500 List - June 2014 http://www.green500.org/lists/green201406 7.■後藤弘茂のWeekly海外ニュース■NVIDIAが世界最多トランジスタ数のチップ 「GK110」を公開 http://pc.watch.impress.co.jp/docs/column/kaigai/20120517_533500.html 2014年7月12日 Kernel/VM北陸 76
  77. 77. 2014年7月12日 Kernel/VM北陸 77 8.信頼性試験(コンデンサの劣化評価・寿命予測)Panasonic解析センター http://www2.panasonic.co.jp/aec/reliability/electronic.html 9.西村一弘, 茂木正徳, 酒井秀久, 川瀬佳子, 作山誠樹, 今村和之, 森宗克文. 鉛フリーはんだbga 寿命解析(5. 材料設計)(<特集> エレクトロニクス実装のためのシミュレーション技術). エレクトロニクス実装学会誌, Vol. 4, No. 5, pp. 416-420, aug 2001. 10.荘司郁夫, 森史成, 藤内伸一, 山下勝. 熱サイクル負荷を受けるSn-ag 系pb フリーはんだ接合部の破断寿命評価. エレクトロニクス実装学会誌, Vol. 4, No. 4, pp. 289-292, jul 2001. 11.3.3.1 温度プロファイルの考え方 ルネサス http://japan.renesas.com/products/package/manual/3/3_3/3_3_1/index.jsp 12.信頼性評価試験 尼崎事業所 日鉄住金テクノロジー株式会社 http://www.nsst.nssmc.com/research_support/shinrai_handa.html 13.高橋浩之, 廣畑賢治, 久野勝美, 川上崇, 小澤直行, 笹原邦彦. リフロー・フロー混載実装における鉛フリーはんだ接合部のはく離強度評価. エレクトロニクス実装学会誌, Vol. 8, No. 4, pp.301-307, jul 2005.
  78. 78. 2014年7月12日 Kernel/VM北陸 78 15.Youtube検索 [PS3 YLoD fix ] 34,900件 https://www.youtube.com/results?search_query=PS3+YLoD++fix 16.PlayStation®製品をご愛用のお客様へご使用上の注意のお知らせ http://www.jp.playstation.com/info/support/nr_20121222_ps.html 17.2007年7月5日 Microsoft 公式ティザ XBOX360について http://www.microsoft.com/en-us/news/press/2007/jul07/07-05warrantyextentionpr.aspx 18.Youtube検索 [xbox360 towel trick] 16,200件 https://www.youtube.com/results?search_query=xbox360+towel+trick 19.加熱処理を用いた故障したGPUの再生実験

×