我有一個問題,我似乎無法在這裏解決。可以說我在這裏有一些像beneth這樣的html,我想解析。所有這些html都在頁面上的一個列表中。這些名字就像我寫的例子一樣重複着自己。重複僅發生幾次,並與htmlagilitypack C#不同值的對象。
<li class = "seperator"> a date </li>
<li class = "lol"> some text </li>
<li class = "lol"> some text </li>
<li class = "lol"> some text </li>
<li class = "seperator"> a new date </li>
<li class = "lol"> some text </li>
<li class = "seperator"> a nother new date </li>
<li class = "lol"> some text </li>
<li class = "lol"> some text </li>
我確實設法使用htmlagility包來解析每個li對象,並且幾乎是按照我的想法來格式化它。我打印ATM看起來是這樣的:
"a date" "some text"
"some text"
"some text"
"some text"
"a new date" "some text"
"a nother new date " "some text"
"some text"
"some text"
我想要什麼才達到:
"a date" "some text"
"a date" "some text"
"a date" "some text"
"a date" "some text"
"a new date" "some text"
"a nother new date " "some text"
"a nother new date " "some text"
"a nother new date " "some text"
但問題是,每一個分隔符下方,每一個笑的對象的數量可能會有所不同。所以有一天,網頁可能有一個笑話對象,它的日期是1,第二天它可能有10個笑話對象。所以我很沮喪,如果有一種智能/簡單的方法來計算分離器之間的大聲笑對象的數量。或者如果有另一種方法來解決這個問題呢?以htmlagilitypack爲例。是的,我需要在每一個笑話對象面前都有正確的日期,而不僅僅是第一個面前。這將是蛋糕的PICE如果分隔符類將結束最後笑的對象之下,但可悲的是不是這樣的......我不認爲我需要在這裏貼上我的代碼,但basicly什麼,我要做的就是解析頁面,提取分隔符和lol對象並將它們添加到列表中,在那裏我將它們分割爲分隔符和lol對象。然後我把它打印到一個文件中,由於分隔符只出現3次(在這個例子中),我只會得到3個不同的日期。
感謝你的小費!我認爲這會幫助我解決我的問題! :) – dtd