1
後,我在大熊貓解析多字符分隔符CSV格式如下大熊貓無效轉義序列更新
big_df = pd.read_csv(os.path.expanduser('~/path/to/csv/with/special/delimiters.csv'),
encoding='utf8',
sep='\$\$><\$\$',
decimal=',',
engine='python')
big_df.iloc[:, -1] = big_df.iloc[:, -1].str.replace('\$\$>$', '')
big_df = big_df.replace(['^<', '>$'], ['', ''], regex=True)
big_df.columns = big_df.columns.to_series().replace(['^<', '>$', '>\$\$'], ['', '', ''], regex=True)
這個工作得很好,直到我最近升級我的熊貓安裝。現在我看到很多廢棄警告的:
<input>:3: DeprecationWarning: invalid escape sequence \$
<input>:3: DeprecationWarning: invalid escape sequence \$
<input>:3: DeprecationWarning: invalid escape sequence \$
<input>:3: DeprecationWarning: invalid escape sequence \$
<input>:3: DeprecationWarning: invalid escape sequence \$
<ipython-input-6-1ba5b58b9e9e>:3: DeprecationWarning: invalid escape sequence \$
sep='\$\$><\$\$',
<ipython-input-6-1ba5b58b9e9e>:7: DeprecationWarning: invalid escape sequence \$
big_df.iloc[:, -1] = big_df.iloc[:, -1].str.replace('\$\$>$', '')
,因爲我需要與$
符號,我不能確定如何妥善處理這些警告
使用原始字符串:'R '\ $ \ $><\ $ \ $''等這樣的字符串逃逸,逃逸的正則表達式不干擾。 –
謝謝,這已經是答案。如果你想隨時發佈它作爲答案。 –
謝謝。我會拒絕,但這種貶低似乎是一個非常新的東西,我主要發現github問題的圖書館,如jinja,scikit,sympy等;全部來自過去一週左右。 –