2017-05-16 151 views
0

東西在一個HTML字符串我有一個HTML字符串,其內容如下:搜索通過Python

  <div class="icon-box"> 
    <div class="result"></div> 
    <div class="count">#1244587 - 16</div> 
    </div> 

這種模式重複數百次只,從邏輯上講,其他號碼。第一個/左邊的數字總是有相同數量的數字,第二個/右邊的數字有一個或兩個數字。

現在我需要兩個數字分別在tabel中。每個都在一個單獨的列中。我試圖用re.search/re.findall來做到這一點,但我遇到了'<'和'#'的問題。

回答

0

我使用split()來搜索那樣的字符串。隔離第三行則

thirdline.split(">")[1] 

獲得「#1244587 - 16 ...」,然後因爲你知道,左側的數字總是有7個數字,你可以採取的字符串,字符串做[1:7]得到左邊的號碼。然後做

string[11:len(string)].split("<") 

擺脫最後的「<」。然後,您可以將它們轉換爲浮點數並將它們追加到列表中,以製作一張表格。