我需要在HTML文件內搜索標題(字符串)。 爲此,我做了strstr以獲得標籤「li」,其中包含標籤「title = \」,其中包含我想要的字符串。如何在HTML中搜索字符串模式,用C編碼?
例如:使用下面的這個數組,我需要得到書名的內部標題。但是,我需要HTML體內的所有標題,其中有數百個。
<li><i><a href="/wiki/Animal_Farm" title="Animal Farm">A Revolução dos Bichos</a></i> (<a href="/wiki/1945" title="1945">1945</a>), de <a href="/wiki/George_Orwell" title="George Orwell">George Orwell</a>.</li>
我試圖運行一個「for」使用strlen來獲得它的循環條件(行長度)。這裏面的,我用的strstr拿到冠軍=」字符串最後複製到引號結束
是這樣的:
for (i=0, i<len, i++){
if(strstr(array[i] == " title=\""){
do{
temp[i] = array[i];
}while((strcmp(array[i], "\""));
}
}
這就是我掙扎點如何。得到的字符串,字符串內,使用模式(條件)? 有什麼建議?
預先感謝您! 問候。
你真正需要的是來自編譯器構造的前端。但我想這種工作是在你的技能atm上。你不能使用現有的HTML解析器庫嗎? – bash0r 2014-11-24 15:06:21
strstr將它的第一個arg作爲字符串指針。它也返回一個字符串指針。因此,只需將整個文件加載到char數組中,查找title =「將開始的字符串設置爲」foundtitle「,然後爲」using「foundtitle做一個strstr」作爲開始字符串指針。使用指針算術來獲得找到的標題的大小,並將其指定到一個char *數組中,或存儲起始點和長度。然後重複,使用找到的標題的末尾作爲起點 – Vorsprung 2014-11-24 15:11:47
,您絕對是@ bash0r。正如我所看到的,它對我來說太複雜了。但我會更詳細地瞭解它,當然。謝謝! – 2014-11-24 16:22:52