2010-10-27 43 views
0

我想找到種子數據加載到我的詞典中。我只需要這個詞的正字法表示(字母)和定義。美國英語詞典的種子數據

我在找一個包含這些信息的文本文件來解析然後加載到我的數據庫中。我使用的是rails,所以如果有一個gem或插件可以做到這一點,如果有人知道它會很好。

回答

4

在這裏你去:

http://www.gutenberg.org/ebooks/673

比你需要它可能有更多信息,但你可以分析出你想要的東西。 Gutenberg項目將公共領域(包括過期版權)的書籍轉換爲文本形式。

+0

我會檢查出來,50 MB文件:) – s84 2010-10-27 01:53:25

1

我知道的一個這樣的數據庫是WordNet,但這不僅僅是一個文本文件。你將不得不根據你想要的格式解析出你需要的東西。

還有其他的。 GCIDE是一個基於XML的數據庫,不僅包含WordNet的定義,還包含1913年版的Webster's Revised Unabridged Dictionary(後者現在在美國爲公有領域)中的一些。

+0

wordnet db是在prolog中編寫的,不知道prolog是如何找到這些單詞的。看起來單詞和定義被轉換成數字,然後序言知道如何閱讀它,我不確定。 – s84 2010-10-27 01:55:23

相關問題