我想從網站(html)中獲取信息到MATLAB中。我能夠從網上得到HTML到使用字符串:Matlab文本字符串/ html解析
urlread('http://www.websiteNameHere.com...');
一旦我有串我有一個很長的字符串變量,包含完整的HTML文件的內容。從這個變量中,我正在尋找特定類中的值/字符。例如,HTML /網站都會有一堆線,然後將在以下形式的興趣類:
...
<h4 class="price">
<span class="priceSort">$39,991</span>
</h4>
<div class="mileage">
<span class="milesSort">19,570 mi.</span>
</div>
...
<h4 class="price">
<span class="priceSort">$49,999</span>
</h4>
<div class="mileage">
<span class="milesSort">9,000 mi.</span>
</div>
...
我需要能夠得到<span class="priceSort">
和</span>
之間的信息;即上述例子中的39,991美元和49,999美元。什麼是最好的方式去做這件事?如果標籤的具體開始和結束也是相同的(如<price>
和</price>
),我會沒有問題...
我也需要知道最健壯的方法,因爲我希望能夠找到<span class="milesSort">
等這類信息。謝謝!