2012-07-20 88 views
8

我需要一個基於牛津詞典單詞列表的詞典文件。現在我可以訪問Linux的單詞列表,這對我的目的不利。有沒有人知道我可以下載這個,因爲小時的谷歌搜索引發了一個空的參數異常!牛津詞典的單詞表文件

任何幫助,非常感謝。 乾杯。

+0

您可以查詢提供api的在線詞典並製作自己的單詞列表。 – LanguagesNamedAfterCofee 2012-07-20 03:23:34

+3

@LanguagesNamedAfterCofee這是我見過的最含糊的評論:-) – 2012-07-20 04:01:57

回答

11

儘管您不可能下載OED列表,但有很多不同的單詞列表可用。不過,您可能需要做一些工作來區分單詞和定義。

一個良好的開端是http://www.dicts.info/dictionaries.php

Moby project看起來很有希望,特別是他們的610,000+詞表(最後一個鏈接頁)。您也可以下載Wikitionary dump。您必須從XML中提取單詞。

很多選擇。你應該能夠找到一個適合你的需求。

+0

感謝百萬隊友,實際上「Moby Thesaurus」正是我所需要的。 ;-) – MaYaN 2012-07-20 17:08:21

6

起步比較晚,但是這將下載的中英文維基詞典所有單詞壓縮列表,而不需要解析XML(儘管一些最起碼的分析是必要的):

curl http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles.gz ~/Downloads/titles.gz 

從那裏,所有的你需要做的是解壓縮文件,並使其成爲一個純文本文件:

gunzip ~/Downloads/titles.gz 
mv ~/Downloads/titles ~/Downloads/titles.txt 

爲了解析列表,使用這樣的事情,這將檢索完全由小寫英文字母的所有單詞的列表:

grep "^[a-z]\{1,\}$" ~/Downloads/titles.txt | sort | uniq >> ~/Downloads/words.txt 
+0

感謝您的回答,非常有用 – MaYaN 2014-05-01 15:21:17

+2

這裏的任何人在2016年後:網址是https://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles.g 注意http ** š** – Chewtoy 2017-02-20 10:05:07