0

我的客戶和我的支持人員之間有20,000條消息(電子郵件和實時聊天的組合)。我也有我的產品知識庫。建議基於文本內容的how-to文章列表

很多時候,客戶提出的問題都很簡單,我的支持人員只是將它們指向正確的知識庫文章。

爲了節省我的支持人員時間,我想要做的是根據初始用戶的支持請求向我的員工展示可能相關的文章列表。這樣,他們可以將鏈接複製並粘貼到幫助文章,而不是加載知識庫並手動搜索文章。

我想知道我應該調查什麼解決方案。

我的想法的當前行是對現有數據運行分析和使用文本分類方法:

  • 對於每封郵件,看看是否有一個鏈接到一個響應的how-to文章
  • 如果是,提取關鍵短語(微軟認知服務)
  • TF-IDF?
  • 將每個操作都視爲屬於多組關鍵短語的「分類」
  • 使用一些有監督的機器學習,支持向量機可能用來預測哪個「分類」,又名「how-to article」屬於確定的關鍵短語從一個新的支持票。
  • 將新的響應反饋回集中以使系統更加智能化。

不知道我是否過於複雜的事情。任何建議如何做到這一點將不勝感激。

PS:將「關鍵短語」傾倒到我們知識庫的搜索查詢中的天真方法產生的結果很差,因爲幫助文章的內容通常與某人在電子郵件或實時聊天中如何說出他們的問題不同。

+0

這是我剛剛獲得的機器學習理論的一個有趣應用! – JackCColeman

回答

0

沿着「垃圾郵件」分類器的簡單分類器可能工作,但每個常見問題解答將是一個功能,而不是垃圾郵件的單個功能分類器,而不是垃圾郵件。

大多數垃圾郵件分類器都以單詞/短語詞典開頭。你已經有了一個天真的方法開始。但是,與您的方法不同,垃圾郵件分類器不僅僅是文本搜索。本質上,在垃圾郵件分類器中,客戶電子郵件中的每個字都被賦予一個權重,權重總和表示郵件是垃圾郵件還是非垃圾郵件。現在,將其擴展到與FAQ相同的功能。即:FAQ1或不FAQ1,FAQ2等

由於您的支持人員可以輕鬆識別電子郵件需要哪些常見問題解答,因此使用監督學習算法將是適當的。爲了減少任何錯誤分類錯誤的影響,請考慮應用程序向支持人員提供客戶的電子郵件,然後是計算機生成的響應,並且所有支持人員需要做的是批准響應或修改響應。修改響應應該會在訓練集中產生一個新條目。

支持向量機是一種實現機器學習的方法。但是,在使用更復雜的方法之前,您可能會首先提出這種解決方案,以便在首先確定問題的過程中提前解決問題,然後儘可能使用簡單的方法進行工作。畢竟,如果一個多功能的垃圾郵件分類器的工作原理爲什麼投入更多的時間和金錢在別的東西上也行得通?

最後,根據您的系統,這是我想要做的事情。