2016-10-23 45 views
1

我正在研究使用SentiwordNet3詞庫的情感分析項目。問題是,我無法理解詞彙的結構。此詞典中的一個線是:SentiWordNet的內部結構3

一個00002730 0 0 acroscopic#1面或上側朝向頂點

1.a =? a的用途?

2.POS-ID=00002730POS-ID的目的是什麼?

SynsetTerms Gloss = acroscopic#1 facing or on the side toward the apex

  1. 什麼是acroscopic?是我們想要得分的詞嗎?
  2. 什麼是#1?目的?
  3. 爲什麼在#1之後的句子? facing or on the side toward the apex

至於得分的訪問而言,我們訪問它作爲

`list(SWN.senti_synsets(Tagged[i][0],'a')` 

aAdjectivevrn也都在詞典。

回答

0

語料庫具有包含列的定義的報頭:

POS ID PosScore NegScore SynsetTerms光澤

  1. POS 'a' 爲語音(形容詞)的部分
  2. ID是WordNet中引理的唯一標識符
  3. PosScore =>陽性得分
  4. NegScore =>負得分
  5. SynsetTerms => WORDNET同義詞集名稱(#1 =第一感測,#2 =第二感測)
  6. 解釋性句子
+0

所以,如果我們得到'列表(SWN.senti_synsets(標記了[I] [0 ],'a')'哪個感覺會被返回?如何確定感覺? – Amar

+0

那麼,它會返回所有的感官。它將返回包含引物列表的synset列表。下面是一個例子:http://www.nltk.org/howto/sentiwordnet.html下面是如何完成WN和SWN之間的映射:https://github.com/bogdan-ivanov/wnext/blob/master/sentiwordnet。 py – bogs

+0

這個'from nltk.corpus import sentiwordnet as swn happy = swn.senti_synsets('happy','a') 因爲我開心: print(i)'returns' 在'很高興'中有什麼''。02'和爲什麼'02'在這裏? – Amar