傍晚的人(或早上取決於你在哪裏:))。用Python解析HTML 2.7
我期待解析其中包含類似於下面多段網頁: -
> <p><a name="Abercrombie"></a></p> <h3>Abercrombie Council</h3> <p>Mr
> Billy Smith<br />The Managing Director<br />123 Jones Street,
> London<br />T:02081234567<br /><a
> href="mailto:[email protected]">Email</a></p>
什麼我希望做的是從網頁捕獲源代碼,然後通過它解析提取上面的獨特信息,並將其放置在製表符分隔的文檔中,並在末尾添加一行 - 分割標題,辦公室名稱,個人姓名,工作角色,地址,電話號碼,電子郵件地址。
我一直在尋找使用BeautifulSoup,但我只是想知道是否有任何其他工具更適合?