2010-06-21 21 views
2

用於語言學習Web應用程序,您是否知道數據結構和底層數據庫架構/佈局,可以高效地存儲,處理和查詢句子,動詞,名詞等。對於不同的自然語言?例如,我想存儲每個動詞只有一次,並將句子鏈接到一個動詞對象等高效的自然語言數據結構,持久性和查詢

我碰到concrete syntax trees,我想使用抽象的節點類,並從它派生名詞類等。語法樹結構太嚴格了?

我意識到這是一個相當廣泛的問題,我不希望你做我的「家庭作業」,但如果你能指出我的任何資源,你知道這可能會幫助我開始,將不勝感激。

謝謝

的Martijn

+1

不要忘記,在某些語言中,根據上下文使用不同形式的相同單詞,因此只需存儲一次即可。 – vava 2010-06-21 15:48:03

回答

2

你的例子看起來非常穩固自然語言/句子操控方面。

關於其他選項..文本搜索/存儲,你可以看看Patricia tree。有關在Google code上使用Java的實現。

另外,您是否考慮使用現有解決方案之一,如HunspellLuceneSphinx

+0

謝謝!我會看看這些鏈接。看起來很有希望。 – 2010-06-21 20:40:05