2014-02-25 27 views
7

我已經看到了一些它們或者處理歸檔或二進制數據或複製文件的腳本(不使用python默認功能)的使用偏移緩衝部門「chunk」,「block」,「offset」,「buffer」和「sector」是什麼意思?

我已經創建了一個Python應用程序,並且外部庫(存檔/提取數據)或二進制文件滿足了很少的要求。我想現在深入一點,通過編寫我自己的模塊,將這些第三方庫功能加入到我的應用程序中。現在我想知道這些術語的含義以及我可以從哪裏開始。有沒有關於上述主題的任何文檔?

任何與Python編程語言相關的文檔也將被讚賞。

+0

這些詞的解釋在每個實現中都會略有不同...但爲什麼不使用在線技術計算詞典來獲得總體思路? – isedev

+0

所有導致一行解釋。但我想要詳細的解釋。 –

+0

但這就是我的觀點...每個實現的詳細解釋都會有所不同。根據您是在查看「tar」,「cpio」還是「cab」存檔,Microsoft CBF或其他任何內容,塊/塊/扇區可能意味着不同。 'offset'應該(希望)意味着同樣的事情,但它與某些事情有關(*與*的偏移量)。 – isedev

回答

14

組塊用於數據的任何(典型的相當大的)量,其仍然僅是任何尺寸的整體,電子的一部分。 G。文件的前1000個字節。接下來的3000字節可能是下一個

用於固定數量的數據(通常在技術上確定),其通常只是整體的一部分, G。文件的前1024個字節。下一個塊的長度也將是1024個字節。另外,有時候不是所有的塊都被使用; 1034字節文件的第二個也是最後一個塊仍然是1024個字節,但只有10個字節將被使用。

偏移是一個位置距離,通常在某物的開始和感興趣的位置之間;即G。如果天氣數據文件中的第23個字節存儲溫度,則溫度的偏移量爲23個字節。它也可以是數據位置的一個轉變,例如, G。如果出現錯誤並且文件已損壞,則可能是因爲所有字節都向後移位了32個字節(在開始處插入32個零或類似字符後),則整個文件具有32字節的偏移量

緩衝區是一塊內存,其中收集事物以便在緩衝區滿(或接近滿)時將其作爲整體進行處理。一個典型的例子是緩衝輸出;這裏單個字符是緩衝的,直到一條線完成,然後在一次寫入操作中將整行打印到終端。有時緩衝區的大小是固定的,有時它們只有一個上限。

部門就像是一個,整整一個固定大小的部分,但更相關的技術來源。在這種情況下,整體往往是一塊硬件(如硬盤或CD),並且通常扇區包含

+0

謝謝你的詳細解答。有沒有與此相關的文件? –

+1

我不知道有關這些條款的官方文檔。不要忘記,計算機科學是一個相當新的專業領域,很多術語和詞彙或多或少都是基於50年代,60年代和70年代的程序員發明的傳統基礎上使用的。沒有幾個世紀的時間(如同大多數其他科學一樣),理論家可以反覆咀嚼每一個構思的想法,直到達到一個製表者並且這些術語固化爲止。搜索「官方」引用有點像在青少年俚語中要求引用。 – Alfe