2013-07-19 55 views
-2

所以問題是我正在寫一個代碼來檢測文本中的所有美國地址。我遇到了像10.08.2013這樣的情況可能是房屋號碼的問題,因爲在我的算法中,我只是簡單地使用isdigit()來查找數字,而那些少於5位的數字被標記爲房屋號碼。 有什麼辦法可以排除這些數字不被誤認爲門牌號嗎?如何使用C++從文本中提取日期信息

+1

爲什麼你有美國地址夾雜了德國的日期? –

+0

只需在數字周圍尋找分隔符。 – Gorpik

+0

@ R.MartinhoFernandes格式化日期並不重要,重要的是如何將它們與數字區分開來。 –

回答

1

您應該使用正則表達式進行模式匹配。您可以通過C++ here瞭解如何使用正則表達式。

因此,對於從文件中檢索的每一行,或者您可能正在收集該數據,都可以根據模式檢查它以確定它是否爲日期。

This也是一個很好的參考。

這應該是大致你在找什麼:".^[0-9]{2}.[0-9]{2}.[0-9]{4}$."