儘管我以前的答案,我改變了主意,並希望不要有選項/備用,但得到他們。所以,這意味着無論是在TD標籤裏面的東西都必須被捕獲和適當的分類。 我需要創建一個可選的捕獲組,所以無論佈局如何,我仍然可以檢索內容。 應該有這方面的工作,即:
<td> Art: <a href="creator.php?c=GPe">Giuseppe Perego</a> </td>
<td> Writing: <a href="creator.php?c=CCh">Carlo Chendi</a> Art: <a href="creator.php?c=LBo">Luciano Bottaro</a> </td>
<td> Pencils: <a href="creator.php?c=JB">Jack Bradbury</a> Ink: <a href="creator.php?c=SSt">Steve Steere</a> </td>
<td> Pencils: <a href="creator.php?c=JB">Jack Bradbury</a> Ink: <a href="creator.php?c=SSt">Steve Steere</a> </td>
<td> Writing: <a href="creator.php?c=DKi">Dick Kinney</a> Pencils: <a href="creator.php?c=TS">Tony Strobl</a> Ink: <a href="creator.php?c=SSt">Steve Steere</a> </td>
<td> Pencils: <a href="creator.php?c=JB">Jack Bradbury</a> Ink: <a href="creator.php?c=SSt">Steve Steere</a> </td>
<td> Writing: <a href="creator.php?c=BKa">Bob Karp</a> Pencils: <a href="creator.php?c=AT">Al Taliaferro</a> Ink: <a href="creator.php?c=AH">Al Hubbard</a> </td>
<td> Writing: <a href="creator.php?c=DKi">Dick Kinney</a> Pencils: <a href="creator.php?c=TS">Tony Strobl</a> Ink: <a href="creator.php?c=SSt">Steve Steere</a> </td>
<td> Writing: <a href="creator.php?c=VLo">Vic Lockman</a> Art: <a href="creator.php?c=KWr">Kay Wright</a> </td>
<td> Writing: <a href="creator.php?c=MGa">Michele Gazzarri</a> Art: <a href="creator.php?c=GPe">Giuseppe Perego</a> </td>
我創建:
<td>\ {1,3}(?:(?:Writing: <a href="creator\.php\?c=[^>"]*?">(.*?)?</a>).*?)?(?:(?:Pencils: <a href="creator\.php\?c=[^>"]*?">(.*?)?</a>\))?(?:(?:Ink: <a href="creator\.php\?c=[^>"]*?">(.*?)?</a>))?(?:(?:Art: <a href="creator\.php\?c=[^>"]*?">(.*?)?</a>))?\ {1,3}</td>
而且看起來它是工作!
我真的很感謝有人檢查和驗證我的努力。
這不是「不是最好的方式」,它不是一種方式。如果我要求你用麪條釘釘子,那麼完成它的失敗是我的錯,而不是你的。 – msw 2011-01-09 04:41:55
是的,沒錯。不會這樣做,如果我不會以某種方式被迫這樣做...除非你有一個關於如何閱讀一個HTML沒有額外的庫在Python的建議... – Maurizio 2011-01-10 11:15:46
對不起,並不意味着聽起來刺耳。 ..我真的不需要閱讀所有的標籤,只是一些特定的標籤,所以我認爲這可以做到......我可能是錯的,儘管...謝謝! – Maurizio 2011-01-10 11:24:20