2015-09-06 38 views

回答

3

要添加到@ abarisone的回答,實際的同義詞集標識本身可以共發現3.0和共發現3.1 :(

之間的不同。例如,在共發現3.1 椅子103005231-n

然而,共發現3.0它103001627-N,但你可以不看,最多在http://wordnet-rdf.princeton.edu/wn31/103001627-n也不http://wordnet-rdf.princeton.edu/wn30/103001627-n,而是你需要使用http://wordnet-rdf.princeton.edu/wn30/03001627-n它錯誤地重定向到102992974-n

我認爲這是WordNet RDF 3.1 online app中的一個錯誤,因爲102992974-n沒有正式存在。你甚至無法搜索它(包括在線和離線)。如果您在該頁面上獲得RDF/JSON-LD文件,它會爲您提供103005231-n

wn3.1.dict/dict/index.noun

chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700 

有沒有提到02992974在該文件中的任何地方。

這兩個問題都令人困惑。我想知道他們爲什麼在小版本中更改synset ID。


關於共發現同義詞集ID的狀態:

結論是,目前,共發現使用同義詞集合3.0 IDS是最安全的。

對於未來的工作,可以考慮使用來自Global Wordnet Association(即將推出)的跨語言索引。其中將具有與Wordnet 3.0兼容的ID。從wn-users mailing list, 30 Oct 2015

參考文獻:

來源:拉斐爾,尼古拉

的URI從「dblocation」領域,這是一個字節從有關基於字符的數據庫開始偏移 建文件(我是 不知道哪個)。這將從發佈變爲發佈,因爲項目被刪除並添加並移動了 。

來源:彼得·克拉克

據我所知...。僅供參考,一個鮮爲人知的事實是,除了感官被拆分或合併之外,感應鍵(例如,「能力%1:07:00 ::」)在版本 之間是穩定的。這爲 提供了一種穩定的方式,指的是跨版本的同義詞集,而不是使用synset號碼。還有 你可以通過尋找相同的感覺鍵找到不同版本中synset數字之間的映射。 (sensekey-> synset是一個多對一的 映射:一個synset可能有多個感應鍵,每個對應於synset中的每個 單詞+ sense,但感應鍵恰好映射到一個synset。 祝你好運,皮特

來源:約翰·麥克雷

你好亨迪,

是共發現同義詞集標識符是基於字節WordNet中的一個給定的釋放 描述符的偏移,因爲這樣他們遠離 穩定不同版本的WordNets。感覺標識符更穩定,但仍然可能不可靠,因爲感覺會被分割和合並。 此外,還有兩個略有不同的WordNet 3.1版本和 WordNet RDF版本可以接受來自其中的同義詞標識符......當然這是 ,正如其他人所評論的那樣,都非常混亂。

出於這個原因,全球共發現協會已經開始了 跨語種的指數,我們預計很快(即在時間 在一月份全球共發現會議)上線工作,並給每個 同步一個不變的URI。

皮克·沃森最近發表了講好這個和這個幻燈片是 在線瀏覽:http://ldl2014.org/slides/Vossen-LOD-CILI.pdf

就目前而言,我會建議使用WN 3.0標識符鏈接 同義詞集,其中共發現際指數也將基於。

Regards,John

0

如果你看看WordNet's Current Version section下,你會發現:

最新的Windows版本的WordNet 2.1是在3月份發佈的 2005. Unix/Linux/Solaris /等版本3.0。於2006年12月發佈。版本3.1目前僅在線提供。

而且,在談論版本3.0和3.1的區別,你可以閱讀:

共發現3.1數據庫文件ONLY

你可以從這裏下載的WordNet 3.1數據庫文件。請注意, 這不是上述的完整軟件包,也不包含用於運行WordNet的任何 代碼。但是,您可以用這些文件替換3.0本地安裝的 數據庫目錄中的文件,並使用 替換WordNet接口中的文件,從3.1 數據庫返回條目。這只是WordNet 3.1 數據庫文件的壓縮tar文件。

所以區別在於WordNet 3.1僅在線,但可以替換3.0版本的數據庫並使用本地安裝。

你可以找到有關版本3.0 here的文檔。