我正在使用scikit-learn
作爲文本分類問題,我想知道是否有機器學習技術使用一對一互斥映射進行標記。與文本分類標籤一對一匹配
例如,我想根據他們代表的城市來標記三個文檔。我的標籤選擇是紐約,底特律和洛杉磯。我的文件是「大蘋果」,「大城市」和「天使之城」。比方說,這個例子中「天使之城」最接近洛杉磯地圖,而「大蘋果」和「大城市」都應該貼近紐約。然而,我想要一個映射到紐約(「大蘋果」,因爲我們說這樣更合適),一個映射到底特律,因爲紐約已經被使用,而底特律是唯一的選擇,它仍然是符合某種意義。
我想告訴預測器,如果它使用了一個標籤,它不能再使用它,所以它需要對該標籤進行最佳猜測,因爲它只能使用一次。
scikit-learn
或其他庫是否有處理這種一對一(且只有一個)文本分類的功能,就像我想要做的一樣?