2013-08-01 33 views
0

我有一個包含中文和英文的文本文檔。我想分成兩部分,或兩個文件。一個文件只包含中文部分,另一個文件只包含英文部分。有沒有辦法在Java中做到這一點?單獨的中文部分和文本文檔的英文部分

+0

到目前爲止您嘗試過什麼?你能給一份文件的樣本嗎?它是'.doc'文件...還是'.pdf'或..? –

回答

0

你可以用正則表達式來驗證模式中使用字母英文字符轉到零件的部分,以及不驗證其他部分的部分。我認爲這兩個部分是在不同的部分(不是混合在一起),也許如果它們混合在一起,你可能會遇到常見字符的問題(例如,?等等),也許對於你可以看到的這些字符和下一個角色。

我認爲這可能是一種可能性,可能有最好的方法來做到這一點。

編輯:我supose這是一個txt,但在另一種格式只傳遞給TXT之前。