2012-01-30 54 views
0

我閱讀的$ text = FREAD($文件名,文件大小$)的MS Word文檔;如何排除MS Word中創建毫無價值字符正則表達式中使用PHP

然後當我回聲$文本它有一些字符該瀏覽器無法正確顯示和輸出一些破碎的字符。我試圖清除他們與以下正則表達式:

preg_replace('/[^\w]/','',$text);,但它不工作,因爲我想要的。

有人可以幫忙嗎?在評論中已經提到

+1

這不是正確的方法:

否則你可以輸出每行,只保留digit-,字處理和空格charaters的字符串時,試試下面的正則表達式。使用轉換工具(例如antiword或libroffice無頭)。的 – mario 2012-01-30 11:53:14

+0

可能重複[入門PHP讀取Linux上的.doc文件(http://stackoverflow.com/questions/90363/getting-php-to-read-doc-files-on-linux) – mario 2012-01-30 11:54:04

+0

你說得對工具,但我使用共享主機.. – temirbek 2013-12-04 06:01:54

回答

0

正如,你應該使用一個工具,爲.doc文件轉換成更實用像純/文本的東西。

preg_replace("/^([^\d\w\s])$/i", "", $text); 
相關問題