我正在處理文本分類問題,我試圖將類別中的一組詞彙分類,是有很多可用於分類的庫,所以如果您建議使用它們,請不要回答。將文本分類爲類別
讓我解釋一下我想要實現的。 (採取例如)詞
列表:
- 的java
- 編程分類的
- 語言
- C-尖銳
列表。
- 的Java
- 升c
在這裏我們將訓練集,:
- 的java映射到類別1. Java的
- 編程映射到1類。 java
- 編程映射到類別2.c-sharp 名
- 語言映射到類別1.java
- 語言映射到類別2.C銳利
- 升c映射到類別2.C銳利
現在我們有一個短語「最好java編程的書「從給定的短語下面的話 是一根火柴,我們的‘字列表’:
- 的Java
- 編程
「編程」有兩個映射類別「java」&「c-sharp」,所以它是一個常用詞。
「java」僅映射到類別「java」。
所以我們的匹配類的短語是「Java」的
這是來到了我的腦海裏,是這個解決方案很好,可以把它實現,你有什麼建議,我錯過了什麼東西,瑕疵等。
沒有什麼,這就是問題,這是否會起作用,我是否應該花時間嘗試實施? –