2013-01-19 28 views
1

讓我們從問題的最終目的開始:我的目標是建立一個基於單詞的神經網絡,該網絡應該接受一個基本的句子,併爲每個單詞選擇它應該具有的含義在句子本身的產量。然後它將學習關於該語言的某些知識(例如兩個給定單詞之間的可能相關性,在單個句子中找到這兩個單詞的概率是多少等)以及最後階段(學習階段之後)嘗試構建根據一些輸入,一些非常簡單的句子。找到一個合適的詞彙庫建立一個C結構

爲了做到這一點,我需要某種數據庫來表示一種給定語言的詞彙表,從中我可以提取一些信息,如單詞列表,定義,同義詞等等。數據庫應的方式,使得我可以建立C數據結構包含所需的信息,例如

typedef struct _dictEntry DictionaryEntry; 
typedef struct _dict Dictionary; 

struct _dictEntry { 
    const char *word;    // Word string 
    const char **definitions;  // Array of definition strings 
    DictionaryEntry **synonyms;  // Array of pointers to synonym words 
    Dictionary *dictionary;   // Pointer to parent dictionary 
}; 

struct _dict { 
    const char *language;   // Language identification string 
    int count;      // Number of elements in the dictionary 
    float **correlations;   // Correlation matrix between i-th and j-th entries 
    DictionaryEntry *entries;  // Array of dictionary entries 
}; 

或等效的OBJ-C的對象被結構化。

我知道(從Searching the Mac OSX system dictionaries?)蘋果提供的字典是許可的,所以我不能用它們來創建我的數據結構。 基本上我想要做的是以下內容:給定一個任意的單詞我想獲取所有包含A的定義的字典條目並僅選擇這樣的定義。然後我將實現某種交集過程,以便根據句子的其餘部分選擇最合適的定義和同義詞,並建立相關矩陣。讓我舉一個小例子:讓我們假設我輸入一個包含「play」的句子;我想獲取所有的條目(比如「遊戲」,「樂器」,「演員」等),單詞「play」可以相互關聯,併爲他們每個人選擇相應的定義(我不想爲例如提取與「工具」含義相對應的「工具」定義,因爲您無法「彈奏工具」)。然後,我將選擇最適合的這些定義,看看其餘的句子:如果它還包含「演員」一詞,那麼我將分配「戲劇」的意思「戲劇」或另一個合適的定義。 這樣做的最基本方法是掃描字典中的每個定義,搜索單詞「play」,因此我將需要訪問所有定義而不受任何限制,據我所知,使用位於/ Library/Dictionaries下的字典無法完成此操作。可悲的是,這項工作必須離線完成。

有沒有我可以下載的任何可用資源,這使我能夠掌握所有的定義並獲取我的信息?目前我對任何特定的文件格式不感興趣(可能是數據庫或XML或其他任何東西),但它必須是我可以分解並放入數據結構的東西。我試圖谷歌它,但無論我使用的關鍵字,如果我包括單詞「詞彙」或「字典」我(很明顯)只能得到有關在線詞典網站上的其他單詞定義的網頁!我想這不是最好的事情去尋找...

我希望問題是清楚的...如果不是,我會嘗試用不同的方式解釋它!無論如何,提前感謝你們所有人提供有用的信息。

回答

2

可能是免費的本體論,如http://www.eat.rl.ac.uk會幫助你。在大學部門有幾個可用的。

+0

謝謝,這是一個很好的資源。不幸的是,這不是我正在尋找的。我想建立一個類似的相關矩陣,但是EAT有一個不同的方法:他們向大量的人展示一個詞,要求他們回答他們想到的第一個詞,然後收集所有關聯數據。他們的數據是由人(即真實腦)產生的。我的程序應該做的是僅使用詞彙定義自行構建整個數據。此外,它提供的數據庫不包含任何定義。它只包含一個單詞列表及其關聯規範。 – gianluca

+0

只是爲了澄清爲什麼他們的數據對我不好。從真實的人羣協會產生並不能保證一致。它可能發生(並且一直都是這樣),作爲刺激物給出的某個詞會產生一個與刺激本身無關的響應,除了產生它的人之外的任何人。例如,如果你說「風」,我可以很容易地回答「裏雅斯特」,因爲我住在那裏,在裏雅斯特有很多風!然而,裏雅斯特本身與「風」概念無關,任何從未去過那裏的人都絕不會回覆「裏雅斯特」給你的刺激。 – gianluca

相關問題