pandas'read_csv
函數中是否有任何選項可以自動將object
dtype的每個項目轉換爲str
。pandas read_csv將混合類型列轉換爲字符串
例如,我在嘗試讀取一個CSV文件時的情況如下:
mydata = pandas.read_csv(myfile, sep="|", header=None)
C:\...\pandas\io\parsers.py:1159: DtypeWarning: Columns (6,635) have mixed types. Specify dtype option on import or set low_memory=False. data = self._reader.read(nrows)
是否有辦法使得(i)從印刷抑制警告,但(ii)我可以從中提取特定列的字符串中捕獲警告消息,例如6和635在這種情況下(以便我可以修復後續dtype
)?或者,或者,如果我可以指定mixed types
,那麼read_csv
函數應該將該列中的值轉換爲str
?
我使用Python 3.4.2和熊貓0.15.2
可以提供重現此數據的摘錄? – joris 2015-02-23 20:19:42
數據文件相當大,但其中一個特定列有大約5000行,其值爲'1','2','3'或'4',並且大約1600行的值爲'Y'(還有實際上前3000行的值都是'1','2','3'或'4') – uday 2015-02-23 20:26:59