編輯:在嘗試縮小我的問題時,我可能會過度簡化,導致難以回答。讓我再嘗試一次。假設詞典是:將列表導出爲CSV格式的字典
holder = {'key1':['headline1', 'body1'], 'key2':['headline2', 'body2']}
我期待該字典到CSV文件,將代表三列的信息輸出:鍵列,標題欄,身柱。下面提到的答案試圖做到這一點失敗了,原因如下。
希望這更清楚一點。
我颳了一些中國新聞網站,並試圖將結果輸出到CSV文件。刮字後,字典的結構如下:
uniqueID : [headlines, body]
每個故事。我試圖輸出到CSV,最終寫着:
uniqueID1/headlines1/body1
uniqueID2/headlines2/body2
uniqueID3/headlines3/body3
每個那些在不同的列(所以基本上三列,儘可能多的行,因爲我有故事)。
我嘗試使用this question的解決方案,但除了翻轉X軸和Y軸(我知道如何修復)之外,它還將每個標題/故事中的每個角色分成不同的條目並打破角色編碼。由於我不知道如何解決這些問題,我有點卡住了。
如果是有幫助的還是相關的,我編碼字符是這樣的:自然
head_fixed = str(headline)
soup = BeautifulSoup(head_fixed, 'lxml')
good_output = soup.text.decode("unicode-escape").encode("utf-8")
,我也持開放的態度,我正在構建數據的方式是錯誤的建議。
謝謝你的任何想法。
你可以顯示整個代碼或至少一個http://stackoverflow.com/help/mcve。任何人都難以測試他們的解決方案,甚至沒有它就能真正理解你的問題。 – Keatinge
我投票結束這個問題作爲題外話,因爲問題太模糊。 – martineau
唯一ID來自哪裏?你如何得到頭條新聞與故事主體?你真的認爲使用'/'分隔符爲你的csv文件是一個好主意 - 如果故事或正文中包含該字符,該怎麼辦? – martineau