2013-02-05 85 views
4

我想對蘋果應用商店做一些全球統計。一個瓶頸是獲得至少所有當前活動應用程序的ID(這9位數字)。有沒有人知道一種方法來獲取iOS應用商店中當前活動應用的所有id的完整列表。更好的特定類別的所有ID(如「教育」)。獲取所有ios應用程序的全球列表

我嘗試了幾種方法,但都不可靠。

http://iphoneapplicationlist.com/apps/ipad/有一個應用程序列表,但列表在2012年11月停止。此外,蘋果公司在https://itunes.apple.com/us/genre/ios-education/id6017?mt=8提供了一個搜索列表,但這個列表結果是不完整的。 (如果我將它與其他列表進行比較,那麼缺少超過8000個應用程序,特別是我自己的:-))。

所以我的問題是:提供一個人可以自己做一些PHP和JavaScript編程有沒有一種很好的方式獲得所有應用程序的所有應用程序id。

回答

0

我找不到方法獲得全部移動應用程序,但iTunes站點地圖文件似乎包含最近更新的應用程序列表。 (我不知道到底是哪的應用程序中包含的Sitemaps文件 - 一旦我工作了,我會更新這個答案。)

以獲取此列表:

  1. 抓取https://itunes.apple.com/robots.txt。這看起來是這樣的:itunes.apple.com robots.txt file

  2. 抓取這些站點地圖文件。他們引用了更多的站點地圖文件,這些站點地圖文件引用了更多站點地圖文件等。一些站點地圖採用XML格式,一些採用gzipped XML格式,一些採用JSON格式。排除名稱中包含itunes_music的任何網站地圖,因爲它們不包含應用程序。

    大約有12,500站點地圖的利益。在每秒4個站點地圖上,您可以在一小時內下載站點地圖。

  3. 該網站地圖包含loc元素和xhtml:link[href][rel=alternate]元素。解析XML並獲取這些值。

  4. 解析區域/國家代碼和ID的每個URL。

我以這種方式發現了719,344個ID。

相關問題