傑夫在大約一年前提供了一個鏈接,但由於以下鏈接繁瑣,我在此移動了信息。
['-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A','N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan']
來源:http://pandas.pydata.org/pandas-docs/stable/io.html#na-values
無論其
這個列表是不完整的。
import pandas as pd
from StringIO import StringIO
sio = StringIO()
sio.write('"foo","bar"\n"1",""\n"NA","4"')
sio.seek(0)
pd.read_csv(sio, sep=",", quotechar='"')
foo bar
0 1 NaN
1 NaN 4
請注意空字符串是如何不是列表的一部分,但它仍然被默認解析爲NaN?
pd.read_csv(sio, sep=",", quotechar='"',
keep_default_na=False,
na_values=['-1.#IND', '1.#QNAN', '1.#IND',
'-1.#QNAN', '#N/A','N/A', '#NA', 'NA'
'NULL', 'NaN', '-NaN', 'nan', '-nan'])
foo bar
0 1
1 NaN 4
如果這個名單將是默認的,這兩個命令應該產生完全相同的結果。
他們沒有。
如果要複製的pandas.read_csv
默認行爲,這是你需要的資源列表:
參考
['', '-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A','N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan']
大熊貓版本:
pd.__version__
'0.15.2'
的Bug票與熊貓:
https://github.com/pydata/pandas/issues/10700
更新
這是固定的熊貓0.17
http://pandas.pydata.org/pandas-docs/stable/io.html#na-values – Jeff 2014-10-30 17:55:38