我讀過一個csv文件,其中包含8列的熊貓read_csv
。每列可能包含int/string/float值。但是我想刪除那些具有字符串值的行,並返回一個只有數字值的數據框。附加csv示例。
我試圖運行此下面的代碼:在Python中刪除具有字符串值的熊貓數據框的行3.4.1
import pandas as pd
import numpy as np
df = pd.read_csv('new200_with_errors.csv',dtype={'Geo_Level_1' : int,'Geo_Level_2' : int,'Geo_Level_3' : int,'Product_Level_1' : int,'Product_Level_2' : int,'Product_Level_3' : int,'Total_Sale' : float})
print(df)
,但我得到了以下錯誤:
TypeError: unorderable types: NoneType() > int()
我與Python 3.4.1運行。 這是示例csv。
Geo_L_1,Geo_L_2,Geo_L_3,Pro_L_1,Pro_L_2,Pro_L_3,Date,Sale
1, 2, 3, 129, 1, 5193316745, 1/1/2012, 9
1 ,2, 3, 129, 1, 5193316745, 1/1/2013,
1, 2, 3, 129, 1, 5193316745, , 8
1, 2, 3, 129, NA, 5193316745, 1/10/2012, 10
1, 2, 3, 129, 1, 5193316745, 1/10/2013, 4
1, 2, 3, ghj, 1, 5193316745, 1/10/2014, 6
1, 2, 3, 129, 1, 5193316745, 1/11/2012, 4
1, 2, 3, 129, 1, ghgj, 1/11/2013, 2
1, 2, 3, 129, 1, 5193316745, 1/11/2014, 6
1, 2, 3, 129, 1, 5193316745, 1/12/2012, ghgj
1, 2, 3, 129, 1, 5193316745, 1/12/2013, 5
我只計算5列。 Geo_Level_1..3在哪裏? – fredtantini 2014-10-27 08:05:34
您必須發佈完整df的原始數據,您必須在讀取到熊貓之前或之後清理csv – EdChum 2014-10-27 08:17:44
樣本數據在上述列中存在這些錯誤,這就是爲什麼我只給出樣本數據由所有8列組成。 @fredtantini – 2014-10-27 08:50:00