2017-04-20 39 views
0

我試圖在不使用sklearn和類似軟件包的情況下實現tf-idf。有人可以幫助我將DataFrame中的值轉換爲blob對象列表嗎?關於熊貓的tf-idf DataFrame

我有一個列 - 「文本」 一個數據幀,我想一個bloblist爲[TextBlob(文本),TextBlob(文本2),...,TextBlob(Textn) [在這裏找到圖片] 1

我想: bloblist = TextBlob(STR(DF [ 「文本」]值)) 但是這給了我一個清單一樣TextBlob(0 Text1,0文本2,... 0 Textn)

是有一種方法可以消除這些前面的0 ...或者是否有更好的方法

有人請指出我在哪裏米錯了。

+0

嗯,也許有助於[這](http://stackoverflow.com/q/37593293/2901002) – jezrael

+0

我想避免使用sklearn包。 – Prithvi

+1

@ChandaKorat你好像在很多帖子中添加了[tag:dataframe]標籤。請注意,羣組標記只能由擁有2000多個聲望點的用戶執行,並通過一個帶有一致性答案的[元]問題進行協調。 – tripleee

回答

0

這與計算tf-idf值無關,但是這裏有一種獲取TextBlob對象列表的方法。

[TextBlob(t) for t in df.text.values] 
+0

這只是返回一個TextBlob對象與所有'文本'... [TextBlob(「Text1」,「Text2」,...「Textn」)]。 – Prithvi

+0

這將始終返回一個列表。如果其中有一個項目,那麼數據框中也只有一行。你能否包含一張表格來顯示你的數據框的結構? – Gijs

+0

我編輯了這個問題來添加df圖像。 – Prithvi