gz

    0熱度

    1回答

    我有20個.gz文件我想合併在一起(但仍保留原件)。它們都具有相同順序的相同變量,並且都有標題。我想將它們合併成一個.gz文件,並且只包含第一個文件的標題。這些文件非常「大」,因此我不能使用R來合併它們,因爲它會花費太多時間。

    1熱度

    1回答

    我有一個巨大的輸入文件,兆兆字節(它是gzipped(.gz))。 我需要分別讀取每一行,並決定是否將其添加到一個新的文件。 輸出文件也有望在大小TB的,但小,因爲我不會添加的所有文件。 有沒有一種方法,要做到這在C++使用標準庫?我不想使用提升。那可能嗎 ?

    0熱度

    1回答

    我想從.tar.gz壓縮包中讀取單個文件的內容。該文件位於tarball的根目錄中。有沒有一些簡單的方法來做到這一點?我正在考慮像data = Tarball.open('myfile.tar.gz').entry('/myentry').content這樣的事情嗎?

    0熱度

    1回答

    我有一個小問題,我有一個服務器上的一個大的41GB的文件,我需要提取它.. 如何,我會去了解它,該文件是在一個tar.gz格式,它將需要24小時在godaddy服務器上,然後它停止由於某種原因 我需要排除一個文件夾名稱數據這包含大量的數據40.9gb剩下的只是PHP。 home/xxx/public_html/xxx.com.au/data < <這是文件夾,我不需要 我一直在尋找谷歌和其他網站一

    0熱度

    1回答

    我有10行的文件,我正在壓縮到Bz2格式,但是當我解壓縮它時,我看到生成的文件只有9行。有1.5行數據丟失。這是我的壓縮到Bz2的代碼。我使用DotNet zip庫 https://dotnetzip.codeplex.com/ 以下是壓縮代碼,我將文件轉換爲UTF-8和Bz2文件。 static string Compress(string sourceFile, bool forceOverw

    2熱度

    1回答

    我有一個大小約120GB的gz文件。我想運行mapreduce,但由於gz文件不可拆分,只有一個映射器能夠一次處理該文件。該文件存在於hdfs和本地文件中。 可能的選擇我在想: 1)解壓縮gz文件並將其存儲在hdfs中:首先,需要太多時間來解壓縮文件並將解壓縮數據放入hdfs中。此外,我不能直接在hdfs中解壓文件,因爲hdfs沒有zcat或gunzip命令。所以我必須做zcat a.gz | h

    1熱度

    1回答

    我正在使用.gz擴展名文件,我需要以最少的處理時間從文件中刪除特定模式,而不是根本不更改文件。

    0熱度

    1回答

    我想用Minizip庫(建立在zlib上)打開gz文件。 下面是代碼: ...... ...... unzFile uf = unzOpen("MyFile.gz"); ...... 不過的Visual Studio 2013崩潰此消息: 調試斷言失敗! 文件open.c 線98 表達式:( 「無效的文件打開方式」,0) 還有什麼意思?

    6熱度

    1回答

    我有一個超大或損壞的error_log超大tarbell存檔,導致存檔在嘗試提取時掛起。有沒有辦法在解壓縮之前將其從存檔中刪除,或者在Mac OS X終端上解壓縮該特定文件時解壓縮該存檔? 我發現然而如何efficiently-remove-files-from-large-tgz這個帖子,我試過--delete標誌,但收到此錯誤: tar: Option --delete is not supp

    1熱度

    1回答

    我有一個大小爲325 MB的gzip文件。我剛剛發現它從一開始就被截斷了361個字節。 請指教我如何從中恢復壓縮文件。