3
上週之前,我對Python的使用經驗非常有限,因爲我們的網絡上的大型數據庫文件非常有限,突然之間我被迫進入嘗試從html表格中提取信息的世界。python lxml xpath返回帶文本的列表中的轉義字符
經過大量閱讀後,我選擇使用Python 2.7的lxml和xpath來檢索有問題的數據。
xpath = "//table[@id='resultsTbl1']/tr[position()>1]/td[@id='row_0_partNumber']/child::text()"
這產生了以下列表::我已用下面的代碼檢索一個場
['\r\n\t\tBAR18FILM/BKN', '\r\n\t\t\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t\r\n\t\t']
我確認的CR/LF和標籤轉義字符,我想知道如何避免它們?