-1
我正在研究博客作者的性別分類。我使用Weka進行分類。分類器是支持向量機和樸素貝葉斯分類器,但我的準確度在50%到60%之間,現在我對我的功能集有所懷疑。我使用的特點是POStags,單詞,強麥結束,巧妙地等,博客的話,所產生等。 我引用本文博客作者的性別分類
提高博客作者的性別分類
有誰有什麼想法是更好的功能集?
我正在研究博客作者的性別分類。我使用Weka進行分類。分類器是支持向量機和樸素貝葉斯分類器,但我的準確度在50%到60%之間,現在我對我的功能集有所懷疑。我使用的特點是POStags,單詞,強麥結束,巧妙地等,博客的話,所產生等。 我引用本文博客作者的性別分類
提高博客作者的性別分類
有誰有什麼想法是更好的功能集?
作爲一個開放的研究問題,我強烈建議您檢查「evaluation labs on uncovering plagiarism, authorship, and social software misuse」中使用的PAN系列,其中包含數據集和許多關於Author Profiling主題的文章:年齡和性別。
您可以找到the datasets used in 2013 runs和descriptions of the approaches used by several research groups。
您可能想要發佈您所指的論文的網址。 – Dan
http://www.google.co.in/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CCoQFjAA&url=http%3A%2F%2Fwww.aclweb.org%2Fanthology%2FD10-1021&ei=SSDcUti6JIPwiQfXmoCQCA&usg = AFQjCNEhGNYlolqTyGP7aYc4KNaAmnIy0Q&bvm = bv.59568121,d.dGI – user104853
您可能想編輯問題以將其放入帖子中。 – Dan