我想從某個網頁(在線書店)獲取一些數據。如何在Python中解析此網頁(並轉換爲字典)
的網頁看起來是這樣的:http://www.rob389.com/dp/tr/11/9789754681383
我想解析<script>
節包含以下字符串:
tOBJ.DATA[0].MMM00_ITEM_CODE="9789754681383"
凡是ISBN號碼。
我首先需要找到並提取正確的<script>
部分。
然後,我想通過tOBJ.DATA [0]對象的內容進行迭代並將其轉換成一本字典它會是什麼樣子:
my_dict["MMM00_ITEM_CODE"] = "9789754681383"
my_dict["MMM00_TITLE"] = "Uykusuz Bir Gece"
等等...
我想可以用python做很少的幾行,但我弄不明白。
有什麼建議嗎?
在此先感謝。
PS:歡迎任何其他解析建議。
這個肯定會更容易與一個適當的API。 –
我同意,但我看不到任何獲取XML數據的方式。 –
使用BeautifulSoup。易於使用選擇器來處理您要提取的數據。 – nathancahill