Bug #6911
closedSync_m#sync_unlock で ThreadError が発生する場合がある
Description
Sync_m#sync_unlock で ThreadError が発生する場合があります。
原因は Sync_m#sync_lock が同一スレッドを複数回 sync_waiting 配列に push してしまうからです。
同一スレッドが多重に sync_waiting 配列に入っていると、sync_unlock の中で何度もそのスレッドに対して Thread#run が呼ばれます。
すると、1回目の Thread#run でそのスレッドが終了した場合、2回目の Thread#run で ThreadError が発生します。
sync_waiting に同一スレッドが複数回 push された状態を再現するコードを gist に置きました。
https://gist.github.com/3434046
この gist に添付されてる test を実行すると、以下のような結果が得られると思います。
[1/1] SyncTest#test_synchronize = 0.51 s
- Failure:
test_synchronize(SyncTest) [/Users/kenta-murata/work/ruby.git/test/test_sync.rb:57]:
<[#<Thread:0x007f904183aa08 sleep>,
#<Thread:0x007f904183ab98 sleep>,
#<Thread:0x007f904183af58 sleep>]> expected but was
<[#<Thread:0x007f904183aa08 sleep>,
#<Thread:0x007f904183ab98 sleep>,
#<Thread:0x007f904183af58 sleep>,
#<Thread:0x007f904183aa08 sleep>]>.
修正用のパッチも上記 gist に添付してあります。修正方法がこの通りで良ければコミットしたいので、どなたかレビューをお願いします。
Updated by kosaki (Motohiro KOSAKI) about 12 years ago
修正パッチがgistに見つけられないのはぼくだけ?
Updated by mrkn (Kenta Murata) about 12 years ago
わお、ごめんなさい。添付し忘れていたようです。更新しました。
以下にも貼ります。
diff --git a/lib/sync.rb b/lib/sync.rb
index bae05a4..05864c2 100644
--- a/lib/sync.rb
+++ b/lib/sync.rb
@@ -147,7 +147,7 @@ module Sync_m
sync_upgrade_waiting.push [Thread.current, sync_sh_locker[Thread.current]]
sync_sh_locker.delete(Thread.current)
else
-
sync_waiting.push Thread.current
-
sync_waiting.push Thread.current unless sync_waiting.include? Thread.current end @sync_mutex.sleep end
Updated by mrkn (Kenta Murata) about 12 years ago
sync_unlock 内で th.wakeup した後に th.run していますが、th.run のときに既にスレッドが死んでいる場合があるようです。
この状況にも対応できるようパッチを更新しました。
Updated by kosaki (Motohiro KOSAKI) about 12 years ago
- Status changed from Open to Closed
調査した結果 5355と同じだと分かったのであっちのパッチいれます。ごめんね
Updated by kosaki (Motohiro KOSAKI) about 12 years ago
余談なんですけど、なんで Mutex.sleep を thread.run で起こせる仕様なんでしたっけ? Thread.stop, Thread.sleep 以外は起こせないほうが普通の感覚かと思うのですが。
とはいえ、スレッドライブラリはTimeout moduleとかでexeptionが突然飛んできても大丈夫なように書いてあるべきなので、この制限をいれてもSync_mを直さないといけないという結論は変わらないのですが