1
我有這樣的雙字母組的列表:添加雙字母組的大熊貓數據幀
[['a','b'],['e', ''f']]
現在我想這些二元語法與它們的頻率添加到數據幀是這樣的:
b f
a|1 0
e|0 1
我試着用下面的代碼做這件事,但是這會引發一個錯誤,因爲索引還不存在。有沒有一種快速的方法來處理真正的大數據? (如200000的雙字母組)
matrixA = pd.DataFrame()
# Put the counts in a matrix
for elem in grams:
tag1, tag2 = elem[0], elem[1]
matrixA.loc[tag1, tag2] += 1