的前10個元素我有一個數據幀與柱tfidf_sorted
如下:大熊貓:得到一系列
tfidf_sorted
0 [(morrell, 45.9736796), (football, 25.58352014...
1 [(melatonin, 48.0010051405), (lewy, 27.5842077...
2 [(blues, 36.5746634797), (harpdog, 20.58669641...
3 [(lem, 35.1570832476), (rottensteiner, 30.8800...
4 [(genka, 51.4667410433), (legendaarne, 30.8800...
的type(df.tfidf_sorted)
返回pandas.core.series.Series
。
該柱創建如下:
df['tfidf_sorted'] = df['tfidf'].apply(lambda y: sorted(y.items(), key=lambda x: x[1], reverse=True))
tfidf
哪裏是一個字典。
如何從tfidf_sorted
獲得前10個鍵值對?
這是用大熊貓的非常unidiomatic方式。爲什麼在一個系列中存儲列表?爲什麼不使用DataFrame中的列? – Maximilian
當然,我也這麼認爲。你能否建議一種替代方法? –
DataFrame中實際列中的每一列(即第一列是'morrell','melatonin'等)? – Maximilian