考慮:的Java:(首字母縮寫,簡稱等),從列表中解析的話文本
- 文本(可選的HTML標籤)
- 數據庫表與縮寫詞(如「等「, 」所以「,...)
目標:
- 構建一個發現在給定文本中的所有事件分析器
- 建立一個小型的GUI讓用戶選擇,如果發現發生匹配(這由需求將擺動)
- 用戶必須忽略匹配(也必須被標記爲「被忽略」)
- 選項用特殊的XML構造替換任何可接受的事件
我的主要問題是解析器,我剛纔提到的GUI只是給出了一個完整的概述。
任務是構建一個分析器,分析e.x的文本。首字母縮略詞並將其標記用於以後的後處理。任何「標記」都必須以XML標記的形式存在,因爲周圍的環境不接受其他任何東西(我們在以「Spirit」結尾的CMS的DOM編輯器中;))。
有沒有人有暗示的圖書館或做任何人建立這樣的事情?你怎麼會和你會處理事情,如:
- 兩個或兩個以上的話是一個實體
- 句號 - 令牌的句子或部分的一部分,你正在尋找
- 反覆更換 - 用戶接受第一次發生 - 即時更換或緩衝?
任何想法,圖書館暗示,維基百科的文章,不管是誰 - 是有幫助的。我沒有發現任何回答上述所有問題的相關問題。
爲什麼你需要一個解析器來做到這一點?你只需要一個詞法分析器/掃描儀?你不會去看句法結構,而是看單詞。 – LB40 2010-08-12 09:13:55
嗯,如果一個組合,交互,字母和數字不是句法給你,是的;) – 2010-08-12 10:11:45
但你確切地知道你正在尋找的標記,你不會去看語法環境嗎? – LB40 2010-08-12 10:17:34