我有一個二進制字的.doc,看起來像這樣的字符串格式:PHP的字符串編碼無法被strpos()識別?
þÿÿÿÿÿÿÿppp„±¶g œÙ Text in word doc here I'm interested in [|`ñÿ|Standard1$S_HmHnHsHtHOJPJQJCJEH567>
當我贊同這個字符串,我可以看到所有我感興趣的是無法識別的字符之間找到文本(但那些我不擔心他們,因爲我只想要文字)。問題是,PHP似乎並不認爲它是一個字符串,所以我不能用strpos(), strpos(), strchr(), mb_strpos()
搜索它都不返回任何內容。沒有-1,在PHP錯誤日誌中沒有錯誤,只是沒有。
但是,當我撥打gettype()
時,我得到了字符串。我懷疑這是一個編碼問題,但mb_detect_encoding返回UTF-8。我試圖將其轉換爲多種不同的編碼類型,無效。
我該如何讓PHP搜索這個字符串?我知道解析一個Word .doc是一個更復雜的問題,但爲了我的目的,我感興趣的明文是二進制數據。有人對這個有經驗麼?
謝謝:)
自編碼是utf8也許你想嘗試mb_strpos http://php.net/manual/en/function.mb-strpos.php –
感謝您的快速響應,我提到我曾試過。絕對沒有返回。 – Anda
您是否以'UTF-8'作爲參數嘗試過? –