我有數據幀這樣(ID,頻率A B C d E) ID A B C D E
1 5 3 2 1 0
2 3 2 2 1 0
3 4 2 1 1 1
我想此數據幀轉換成基於測試文檔這樣的(ID和在單個列中其頻率ABCDE作爲字)。然後我可以使用LDA算法爲每個ID確定熱門話題。 ID Text
1 "A" "A" "A" "A" "A" "B" "B" "B" "C" "C"
我有一個帶有每日日期時間索引的熊貓數據幀。我想申請重新取樣方法的數值總結到每月一系列這樣的: >>> aggVols.resample('M',axis=1).sum()
但當我嘗試這個,我得到的錯誤 TypeError: Only valid with DatetimeIndex or PeriodIndex
我注意到,該指數的頻率的對象未設置(無)。 >>>aggVols.index
我想結合這兩種方法在我的文檔分析器frequencyCounter和parseFiles中只是出現了一些錯誤代碼。 我希望所有的frequencyCounter應該是一個函數,應該從parseFiles內執行,相關信息不用擔心文件的內容應該傳遞給doSomething,以便它知道要打印什麼。 現在我只是保持瞭如何將這兩種方法放在一起搞亂了,請給一些建議 這是我的主類: public class Y