我希望使用Senseval-2粗略數據集,但有相同的說明(關於數據集的格式)。senseval 2數據集格式
它應該具有決定數據,即兩個意義是否應該合併。中間值是一種信任度量嗎?此外,他們還使用了Wordnet 1.7的預發行版。我可以使用Wordnet 1.7嗎?
從文件的樣品看起來像:
材料%5:00:00:物理:00 3材料%5:00:00:世俗:00
材料%3:00:03 :: 3材料%5:00:00:世俗:00
材料%3:00:04:2材料%3:00:01 ::
材料%3:00:02 ::
post%5:00:00:成功(a):00
本%3:00:01 ::
本%3:00:02 ::
本%3:01:00 ::
石%3:01:00: :
石%5:00:00:色度:00
空氣%1:15:00:4的空氣%1:27:00 ::
空氣%1:19:00 :: 4空氣%1:27:00 ::
空氣%1:27:01:4的空氣%1:27:00 ::
空氣%1:04:00 ::
空氣%1:10:02 ::
空氣%1:07:00 ::
空氣%1:10:01 ::
上訴%1:04:00:3的吸引力%1:10:00 ::
上訴%1:10:02 :: 3上訴%1:10:00 ::