2017-12-18 119 views
-1
維基百科頁面

我希望得到一個維基百科的文章,在「又見」一節中的所有鏈接,但蟒蛇維基API(Wikipedia documentation)不提供這些信息。即使我使用「頁面」功能獲得一個網頁的全部內容以「另見」部分中提取,這部分通常是空的! (如果你使用瀏覽器瀏覽該網頁,它不會是空的!)。獲得「參見」一節中

​​

The "See also" section is not empty! 所以,我認爲,對於獲取這些信息的唯一方法是解析HTML頁面。任何意見,幫助我提取這些信息,而不解析HTML頁面,是值得讚賞的。

+0

這是荒謬的!沒有收到任何評論,兩個人只給了我負面的評價! – woody

回答

1

似乎是一個合理的問題給我。無論如何,你可能還是要解析HTML,但RESTBase API提供了「移動部分」端點組由部分的標題輸出HTML。該API端點看起來是這樣的:

https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Facebook

Documentation provided here

的API響應包含的對象與 '部分' 財產這樣

"remaining": { 
    "sections": [ 
     { 
     "id": 39, 
     "text": ..., 
     "toclevel": 1, 
     "line": "See also", 
     "anchor": "See_also" 
     }, 
    ... 
    ] 
} 

有了這種反應,你可以選擇HTML從其line屬性字符串「又見」相匹配的部分。