2015-02-11 200 views
1

我想讀取一個csv文件(〜190MB大小)到一個熊貓數據框,但我得到這個錯誤。我從JetBrains公司Python終止進程退出代碼-1073741819

Process finished with exit code -1073741819 (0xC0000005) 

我試圖運行的代碼運行Pycharm IDE低於:

from pandas import DataFrame as df 


if __name__ == '__main__': 
    frame = df() 
    frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True) 
    ab = list(frame.columns.values) 
    print(ab) 

這是從CSV一個實例:

createdat text coordinates entities id_str in_reply_to_user_id_str 
Tue Feb 10 18:56:42 +0000 2015 

"RT @RubieDubes: official list of deluded XXXXX: 
Spurs Fans 
Kanye West 
Louis van Gaal"  

{'trends': [], 'urls': [], 'user_mentions': [{'id': 65174814, 'name': 'Ruby ?', 'screen_name': 'RubieDubes', 'indices': [3, 14], 'id_str': '65174814'}], 'symbols': [], 'hashtags': []} 

5.65223E+17 

編輯:我嘗試使用python控制檯運行它,並導致錯誤:在python.exe [11640]中發生未處理的win32異常。

+0

刪除原始數據中的褻瀆 – EdChum 2015-02-11 09:33:21

+0

請縮進CSV。 – 2015-02-11 09:46:22

+0

我編輯了CSV數據,以便每個類似的代表列的內容,即第一個是創建,第二個是文本,座標是空的,實體下一個和最後一個id_string – 2015-02-11 23:55:16

回答

2

我想出了問題所在。 CSV中存在的值類似於解析器未正確讀取的值。我改變了代碼從

frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True) 

data = pandas.read_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', encoding='latin-1', engine='python') 

猜測以UTF-8編碼是造成問題。代碼在我將其更改爲'latin-1'時運行。感謝您的幫助。

編輯:我想這是由於表情符號存在於數據中造成的。

相關問題