1
我想分析從土耳其虛擬社區網站獲取的文本語料庫,以在抗議期間檢查用戶生成的內容。具體而言,我計劃應用LDA來確定主題。我之前沒有使用過LDA,我不知道它是否適用於不同的語言環境。我可以將LDA(潛在的dirichlet分配)應用於不同語言的語料庫嗎?
謝謝
我想分析從土耳其虛擬社區網站獲取的文本語料庫,以在抗議期間檢查用戶生成的內容。具體而言,我計劃應用LDA來確定主題。我之前沒有使用過LDA,我不知道它是否適用於不同的語言環境。我可以將LDA(潛在的dirichlet分配)應用於不同語言的語料庫嗎?
謝謝
是的,我看不出爲什麼沒有。可能很難找到一些預處理步驟的盒外解決方案,但顯然它以前已經完成:http://ieeexplore.ieee.org/xpl/articleDetails.jsp?reload=true&arnumber=6830499