2011-03-27 59 views
5

背景如何在的TVar

添加一個終結在回答question,我建立和uploaded a bounded-tchan(不會有適合我上傳jnb's version)。如果名稱不夠,則有界tchan(BTChan)是具有最大容量的STM通道(如果通道處於容量,則寫入塊)。

最近,我收到了添加像在regular TChan's中的dup功能的請求。從而開始了這個問題。

的BTChan看起來如何

BTChan的簡化(實際上非​​功能性)的觀點是下面。

data BTChan a = BTChan 
    { max :: Int 
    , count :: TVar Int 
    , channel :: TVar [(Int, a)] 
    , nrDups :: TVar Int 
    } 

你寫信給你包括元組的DUP(nrDups)的數量的頻道每次 - 這是一個「單獨的元素計」,這表明有多少讀者已經得到了這個元素。

每個閱讀器都會減少它讀取的元素的計數器,然後將它的讀指針移動到列表中的下一個元素。如果閱讀器將計數器遞減到零,則count的值將遞減以正確反映通道上的可用容量。

要清楚所需的語義:通道容量指示通道中排隊的元素的最大數量。任何給定的元素都會排隊,直到每個dup的讀者都已收到該元素。沒有元素應該排隊等候GCed dup(這是主要問題)。

例如,讓有一個信道的3名的DUP(C1,C2,C3)爲2容量,其中2項被寫入信道,那麼所有項被讀出的c1c2。頻道仍然已滿(0剩餘容量),因爲c3尚未消耗其副本。在任何時間點,如果所有對c3的引用都被刪除(因此c3爲GCed),則應釋放容量(在此情況下恢復爲2)。

這裏的問題:假設我有以下代碼

c <- newBTChan 1 
_ <- dupBTChan c -- This represents what would probably be a pathological bug or terminated reader 
writeBTChan c "hello" 
_ <- readBTChan c 

導致BTChan的樣子:

在讀計數 "hello"
BTChan 1 (TVar 0) (TVar []) (TVar 1)    --> -- newBTChan 
BTChan 1 (TVar 0) (TVar []) (TVar 2)    --> -- dupBTChan 
BTChan 1 (TVar 1) (TVar [(2, "hello")]) (TVar 2) --> -- readBTChan c 
BTChan 1 (TVar 1) (TVar [(1, "hello")]) (TVar 2)  -- OH NO! 

通知仍然1 ?這意味着該消息不會被視爲消失(即使它會在實際實施中得到GCed),我們的count也不會減少。由於通道處於容量狀態(最多1個元件),因此寫入器將始終阻止。

我想每次調用創建的終結器dupBTChan。當收集一個重複的(或原始的)通道時,剩餘的要在該通道上讀取的所有元素將獲得每個元素的計數遞減,並且nrDups變量將遞減。因此,將來的寫入將具有正確的count(不會爲GCed通道未讀取的變量保留空間的count)。

解決方案1 ​​ - 手動資源管理(我想避免的)

JNB的有界tchan實際上有這個原因手動資源管理。請參閱cancelBTChan。我正在努力爲用戶弄錯一些東西(不是說手動管理在許多情況下不是正確的做法)。

解決方案2 - 通過阻斷對TVars使用異常(GHC不能做到這一點我多麼希望)

編輯這個解決方案,和解決方案3這僅僅是一個分拆,不行!由於bug 5055(WONTFIX),GHC編譯器向兩個被阻塞的線程發送異常,即使其中有一個是足夠的(這在理論上是可確定的,但在GHC GC中不可行)。

如果獲得BTChan的所有方法都是IO,我們可以在一個線程中讀取/重試給定的BTChan唯一的額外(虛擬)TVar字段。當所有其他對TVar的引用都被刪除時,新線程將捕獲異常,所以它會知道何時遞減nrDups和個別元素計數器。這應該工作,但是我的力量所有用戶使用IO得到他們BTChan S:

data BTChan = BTChan { ... as before ..., dummyTV :: TVar() } 

dupBTChan :: BTChan a -> IO (BTChan a) 
dupBTChan c = do 
     ... as before ... 
     d <- newTVarIO() 
     let chan = BTChan ... d 
     forkIO $ watchChan chan 
     return chan 

watchBTChan :: BTChan a -> IO() 
watchBTChan b = do 
    catch (atomically (readTVar (dummyTV b) >> retry)) $ \e -> do 
    case fromException e of 
     BlockedIndefinitelyOnSTM -> atomically $ do -- the BTChan must have gotten collected 
      ls <- readTVar (channel b) 
      writeTVar (channel b) (map (\(a,b) -> (a-1,b)) ls) 
      readTVar (nrDup b) >>= writeTVar (nrDup b) . (-1) 
     _ -> watchBTChan b 

編輯:是的,這是一個貧窮的芒終結,我沒有什麼特別的原因,以避免使用addFinalizer。這將是同樣的解決方案,仍然強迫使用IO afaict。

解決方案3:比液2一個清潔的API,但GHC仍然沒有通過調用initBTChanCollector,將監視一組,這些假TVars(從溶液2支持

用戶啓動管理器線程)並進行必要的清理。基本上,它將IO推入另一個線程,該線程知道通過全局(unsafePerformIO編輯)TVar做什麼。事情基本上像解決方案2一樣工作,但是BTChan's的創建仍然可以是STM。運行initBTChanCollector失敗會導致任務隨着進程的運行而不斷增長(空間泄漏)。

解決方案4:絕不允許丟棄BTChan小號

這類似於忽視的問題。如果用戶從不放棄重複BTChan則問題消失。

解決方案5 我看到ezyang的答案(完全有效和讚賞),但真的想保持目前的API只是一個「DUP」功能。

**解決方案6 ** 請告訴我有更好的選擇。

編輯: 我implemented solution 3(沒有經過測試的alpha版本),並使得全球本身處理的潛在空間泄露一個BTChan - 這瓚應該可能有容量爲1所以忘了運行init顯示了非常快的,但是這一個小小的變化。這在GHCi(7.0.3)中起作用,但似乎是偶然的。 GHC會向兩個被阻塞的線程(有效的線程讀取BTChan和正在監視的線程)拋出異常,所以如果您在另一個線程拋棄它時引用了BTChan而被阻止,那麼您就死掉了。

+0

我不明白你到底在想什麼。重複頻道的語義應該與資源有關?如果它和重複項都已滿,通道會被阻止?如果其中一個滿了? – 2011-03-27 08:18:13

+0

對,這些語義需要澄清。如果你嘗試實現「一個通道塊,如果它和重複都已滿」,那麼你需要問,我是否允許從隊列中刪除元素?如果答案是否定的,那麼你又有了一個無限制的渠道。 – 2011-03-27 09:59:20

+0

(詢問請求dup的人使用它的計劃也是有用的。) – 2011-03-27 09:59:50

回答

5

這裏是另一種解決方案:要求所有對有界通道重複的訪問都被一個函數括起來,該函數在退出時(通過異常或通常)釋放其資源。您可以使用具有rank-2跑步者的monad來防止重複頻道泄漏。這仍然是手動的,但類型系統使得做淘氣的事情變得困難很多。

你真的不想依靠真正的IO終結器,因爲GHC不能確定什麼時候可以運行終結器:儘管你知道它可能會等到程序結束之前運行終結器,這意味着直到那時你陷入僵局。

+2

經過一段時間的思考,我同意。試圖將終結器用於除內存管理之外的其他任何事情都是錯誤的 - 即, Haskell內部在語義上不可「觀察」的效果。 RAII的慣用Haskell不等於終結者,但是具有「功能」。 – sclv 2011-04-04 14:02:50