2017-07-07 39 views
-1

我正在從大約18列的.csv文件導入的熊貓數據框中工作。每列都有一個項目名稱和一個圖像描述,以html格式作爲列標題。它是這樣的:修整熊貓數據框中列標題的字符串部分

A <img width="300" alt="A" height="300".jpg">` ` B <img width="400" alt="B" height="600".jpg"`...... 

等等。

我想要實現的是隻獲取我的列標題的項目名稱並修剪圖像部分。我想這個替換功能:

df.rename(columns=lambda x: x.replace('<img width="300" alt="A" height="300".jpg">', ''), inplace=True) 

但它不可能給每一個列名作爲有30個這樣的一個類似的文件,每個圖像具有不同的描述。我正在尋找更優雅的解決方案。我想我的輸出是這樣的:

A B C D ......so on 

任何幫助將不勝感激。

回答

2

我會使用一個正則表達式

df.columns = df.columns.str.replace('\s*<.*>\s*$', '') 
0

如果你不熟悉正則表達式,你也可以嘗試:

df.rename(columns=lambda x: x.split(' ')[0], inplace=True) 

因爲總有你需要的輸出之間的空間你不想要一個。

相關問題