我想創建一個表,其中顯示3個文本中的某些詞的頻率,而文本是列和詞是行。爲條件頻率分佈創建一個令牌和文本元組
在表中,我想看看哪個單詞出現在哪個文本中。
這是我的文字和文字:
texts = [text1, text2, text3]
words = ['blood', 'young', 'mercy', 'woman', 'man', 'fear', 'night', 'happiness', 'heart', 'horse']
爲了創造條件頻率分佈我想創建的元組應該像很多= [該列表(「文本1」,「血」) ,( '文本1', '青年'),...( '文本2', '血'),...)
我試圖像這樣創造很多:
lot = [(words, texte)
for word in words
for text in texts]
而不是很多=('text1','blood')等,而不是'text1'是整個t在列表中分機。
如何創建用於條件頻率分佈函數的元組列表?
不知道我完全理解你想要什麼,但是這可能會幫助http://stackoverflow.com/questions/30970342/remove-標點符號從 - 一個列表/ 30970369#30970369 –