我使用Python和硒從下面的網站提取數據: http://www.worldhospitaldirectory.com/klinik-fur-anaesthesiologie-und-intensivmedizin/info/4181硒與Python:如何拉動沒有ID和類的數據?
Screenshot of Page 正如你可以從圖中看到的。我想獲得醫院名稱,類別,地址,國家,電話,網站和電子郵件。
但是當我檢查元素時,我發現沒有id或類名要做。
類別: 綜合醫院
地址: .....
我真的不知道如何從這個網站拉他們。 請幫我或給我一些建議。
嘗試使用XPath –
你可以只拉'outerHTML'並解析它像一個字符串。 –
如果語言沒有改變,那麼你可以使用一些基於文本的xpaths,或者如果結構是相同的,每次都是一樣的,那麼你可以嘗試基於位置。 – lauda