我在編寫一個應用程序,它可以將.txt文件轉換爲用於文本挖掘的單詞包。但是,即使我的應用程序過濾非字母字符,我也會收到非字母字符(如¾和=):在C++中無法識別的字符
我的向量經過一個循環,該循環擦除以ASCII值開始的字符串, 65,90](從A到Z)。這些字符也通過isalpha測試。似乎這些字符不能與字母字符區分開來。
我看不出我如何從我的字符串向量中動態地刪除這些奇怪的字符串。我需要幫助。
我的代碼,因爲它是相當長的論壇帖子。
我的代碼這部分未能擺脫非aphabetic字符開頭的字符串:
for (unsigned int i=0; i<token24.size();i++){
string temp = token24[i];
char c = temp[0];
if(c>90||c<65){
token24.erase(token24.begin()+i);
i--;
}
}
我也試圖與條件
(c>'Z'||c<'A')
您至少需要包含相關的代碼部分;它也將有助於查看您的代碼未正確處理的文本示例。 – computerfreaker
您應該展示一些真實的代碼並解釋程序的邏輯,例如用於讀取文件的編碼以及如何檢測該文件。 – user2485710
我的代碼的這部分未能擺脫以非字母字符開頭的字符串: for(unsigned int i = 0; i 90 || c <65)token24.erase(token24.begin()+ i);如果(c> 90 || c <65)我 - ; } } –
user196672