您好喂zend_lucene_search上下文,它可以搜索單詞達到特殊字符,然後它是不可搜索的。如何使用PHP在上下文中刪除不可讀的字符?
例如:
very well to the other job boards � one of the main things that has impressed is the variety of the applications, especially with regards to the background of the candidates" manoj � Head
如果我搜索「板」我能得到它,但如果我搜索一個或不可讀字符之後的任何字符串,我不能搜索。
如何刪除這些,我想獲得純文本。
我將這些字符轉換成.docx/pdf文件爲文本。
OR
讓我知道如何餵養才Zend_Search_Lucene的文字..
請幫助。
如果字符包括標點符號或其他可讀的字符? – nageeb
@nageeb:'\ x00- \ x7F'範圍也包含標點符號(ASCII)。 – anubhava
我明白,但我認爲用戶會想保留標點符號。 – nageeb