2014-10-01 68 views
0

我正在嘗試在我正在使用的項目中使用OpenNLP,而且我對它很陌生。我嘗試了使用命名實體識別以及http://opennlp.sourceforge.net/models-1.5/ 的培訓數據。但是,我想查看已使用的培訓數據。即實際打開.bin文件並以英文查看其內容。有人可以指出我正確的方向。 我試圖使用UltraISO來讀取.bin文件,但我沒有成功。 PLs help !! Thanx :)如何在opennlp中查看.bin文件的內容

+0

'bin'是* generic *文件的擴展名,表示文件可以是任何東西*,但是*純文本。 (特別是它與「ISO」無關)。您需要正確的軟件才能打開它,或在某處找到文件格式的規格並編寫軟件來閱讀它。 – usr2564301 2014-10-01 11:46:00

回答

0

使用Unix file命令查找文件類型,如file en-token.bin。對於大多數OpenNLP .bin文件,它會告訴你這些只是ZIP文件。

0

bin文件實際上是一個序列化java對象的字節,它表示一個名爲NameFinderME(ME意思是最大熵,這是OpenNLP中使用的主要多項式邏輯迴歸(ish)算法)的TokenNameFinder實現。通過對此文件執行任何操作,您將無法看到培訓數據。 更正:它不是名稱查找程序,它是序列化的namefinderMODEL。