11
我試圖想出一些沿着Google日曆(甚至是一些Gmail郵件)的東西,其中自由格式的文本將被解析並轉換爲特定的日期/時間。如何從自由格式文本中提取日期時間?
一些例子(假設爲簡單起見,自己目前是2013年1月01日凌晨1點):
"I should call Mom tomorrow to wish her a happy birthday" -> "tomorrow" = "2013-01-02"
"The super bowl is on Feb 3rd at 6:30pm" -> "Feb 3rd at 6:30" => "2013-02-03T06:30:00Z"
"Remind me to take out the trash on Friday" => "Friday" => "2013-01-04"
首先我會問這個 - 是否有任何現有的開源庫,這個(或這部分)。如果不是,你認爲我應該採取什麼樣的方法?
我想到了幾個不同的可能性:
- 大量的正則表達式,多達我可以拿出爲每個不同的使用情況
- 某種貝葉斯網,着眼於N-克和分類成不同的情況下,如「相對日期」,「相對星期幾」,「特定日期」,「日期和時間」,然後通過規則引擎運行它(也許更正則表達式)來計算出實際日期。
- 其發送到谷歌搜索,並嘗試從搜索結果中提取有意義的信息(這一項可能是不現實的)
哇,這有我想要的一切!謝謝! – Paul