0
我正在計算文本文件的總數,並且文件夾中有很多文件,包括文本文件和其他二進制文件。如何判斷在Windows環境中使用Java語言的文本文件或二進制文件?
如何判斷文件是使用Java語言的文本文件還是二進制文件?
我正在計算文本文件的總數,並且文件夾中有很多文件,包括文本文件和其他二進制文件。如何判斷在Windows環境中使用Java語言的文本文件或二進制文件?
如何判斷文件是使用Java語言的文本文件還是二進制文件?
如果您在談論純文本,文本文件中有哪些字符? 9(標籤),10(換行),13(回車),32至126(可讀字符)
文本文件應該具有近100%的字符比例。
另一方面,二進制文件使用整個字符集,所以應該有更低的比例。而且,二進制文件通常包含很多0值。
這不是確定文件類型的100%確定方式,但我認爲它應該足夠了。
你可以看看擴展名。或者你可以使用啓發式 - 讀取文件假設UTF8或任何其他,並看看是否有任何字節不適合模具。 – 2012-04-04 15:33:27
這是一個功課題嗎? – 2012-04-04 15:34:29