因此,該場景如下:有更多的小型Azure存儲blob容器(每個都有一些blob)還是一個非常大的容器有大量blobs?
我有一個Web服務的多個實例,它將一組數據寫入Azure存儲。我需要能夠將blob分組到容器(或虛擬目錄),具體取決於它何時收到。偶爾(每天最糟糕的時候)舊的斑點會被處理,然後被刪除。
我有兩個選擇:
選項1
我做一個集裝箱被稱爲「斑點」(例如),然後存儲所有的博客到該容器中。每個BLOB將使用目錄樣式名與目錄名是它接收的時間(如「hr0min0/data.bin」,「hr0min0/data2.bin」,「hr0min30/data3.bin」,「hr1min45/data.bin 」,......, 「hr23min0/dataN.bin」,等等 - 一個新的目錄中的每個X分鐘)。處理這些blob的事件將首先處理hr0min0 blob,然後處理hr0minX等等(並且在處理時仍然正在寫入blob)。
選項2
我有許多容器各自與基於所述到達時間的名稱(因此第一將是一個容器稱爲blobs_hr0min0然後blobs_hr0minX等),並在容器中的所有斑點是那些斑點那到達了指定的時間。處理這些博客的內容將一次處理一個容器。
所以我的問題是,哪種選擇更好?選項2是否給了我更好的並行化(因爲容器可以位於不同的服務器中),還是選項1更好,因爲許多容器可能會導致其他未知問題?
哇 - 很好的時間... :) – dunnry
謝謝你,這使得決定清晰和容易! – encee
請問,是否有必要儘可能縮短斑點名稱? (我有「一個非常大的容器有大量的斑點」,問題中的選項1.) – nmit026