2011-09-19 42 views
2

我使用MediaWiki API來查找維基百科文章的圖像。但是,我還會得到所有無用的圖標,例如掃描文章需要清理時的掃帚,或者創作共用標誌,標誌某些東西置於創意公共許可證下。MediaWiki API:尺寸,其中嵌入/丟失無關圖標的圖像

有沒有辦法檢測哪些圖像是這樣的圖標,所以我可以放棄它們?例如。有沒有辦法查詢圖像嵌入的大小(而不是原始圖像的大小,即使是圖標也可能很大),以便我可以放下所有小圖像。無論如何,我對真正的小圖像並不感興趣。

+0

現在class = metadata也被使用了。 – Nemo

回答

1

據我所知,沒有。該信息根本不存儲在數據庫中,因此也不能通過API獲得。

有些事情可以做也許包括:

  • 載文章的HTML標記(通過API action=parse,或者乾脆通過的index.php與action=render),並從中提取的圖像尺寸。

  • 只需構建應排除的圖像列表。您可以以編程方式執行此操作(例如,查找Category:Wikipedia maintenance templates及其所有子類別中包含的所有模板上使用的所有圖像),或只是在遇到它們時將任何不需要的圖像添加到排除列表中。