1

許多技術可以用於檢測特定語言的垃圾郵件,如果採用了適當的技術,它可以使系統能夠檢測多種語言的垃圾郵件,但這需要一個文本在一個具體語言。多語言文本垃圾郵件檢測

所以我的問題是如何檢測由多種語言組成的文本?這不僅僅關於語言檢測。我想知道一些做多語言文本垃圾郵件檢測的最佳做法。

回答

0

一個天真的解決方案仍然使用翻譯API按照語言將文本分割成片段。然後通過語言對文本片段進行分類。

這是一個直截了當的解決方案,但由於經常調用翻譯API,所以我擔心性能。

我想知道大公司或一些優秀的項目如何處理這個問題?