2016-06-29 88 views
29

如果包裝很受歡迎,即使它的受歡迎程度是另一個流行包裝中某些「導入」情況的原因,也可以很容易地得到一個想法。但是現在由於某種原因我沒有看到這些信息。爲什麼PyPi不再顯示下載統計信息?

一個例子:https://pypi.python.org/pypi/blist

爲什麼他們關閉此有用的東西?

+0

[看起來像惡意下載統計是一個已知的bug已被標記爲'wontfix' - 也許他們因此被刪除?](https: //bitbucket.org/pypa/pypi/issues/396/download-stats-have-stopped-working-again) –

回答

32

this mail.python.org article可以看出,下載統計信息被刪除,因爲他們沒有更新,而且很難修復。

唐納德Stufft,該文章的作者,列出這些原因:

有許多原因,他們的拆卸/折舊其中一些 是:

  • 技術上很難做工作,新CDN
    • CDN正在捐贈給PSF,並且捐贈的層級不提供任何形式的日誌訪問
    • 周圍的工作不具有日誌訪問會大大降低的CDN
  • 非常不準確的效用
    • 一些東西防止下載次數從不準確,其中一些包括:
      • PIP下載緩存
      • 內部或非官方的鏡子
      • 包未託管PyPI上(用於比較的緣故)
      • 鏡像或非官方抓取腳本導致虛高(最後,我看到下載的25%來自已知鏡像 腳本)。
  • 不是特別有用
    • 僅僅因爲一期工程已經下載了很多,並不意味着它的好
    • 同樣僅僅因爲一個項目還沒有被下載了很多不意味着它是壞的
+6

接受的答案是正確的,下載已被禁用,並且Donald Stufft 2013年的電子郵件中的原因很可能仍然非常有效。但自2013年以來,下載已重新啓用,並且僅在最近(〜2016年6月?)才被禁用。在[pypi-legacy issue#396](https://github.com/pypa/pypi-legacy/issues/396#issuecomment-232373133)中可以找到更多細節。 – orbeckst

21

最近我發現Ø通過這個link你可以查詢PyPI的大查詢數據庫。

另外我寫了一個blog post關於如何獲取這個信息,如果你想看看。

+0

太棒了!我想知道更多關於這些數據的準確性 – nemesisdesign

+0

@nemesisdesign我相信它每天都會更新。您可以嘗試分析所有19099214行的合法性/準確性。 –

+1

@ kiran.koduru我試過了你的博客文章的指示,但從Google說法表中獲取錯誤消息不存在。這種檢索包元數據的方法仍然有效,或者表名已經改變了? – toske

1

pypinfo程序是一個Python3命令行程序,可通過pip安裝BigQuery。如果您設置了憑證(JSON文件),你應該能夠編寫:

$ pypinfo -d 1825 blist year 
Served from cache: False 
Data processed: 250.31 GiB 
Data billed: 250.31 GiB 
Estimated cost: $1.23 

| download_year | download_count | 
| ------------- | -------------- | 
|   2,017 |  443,067 | 
|   2,016 |  391,816 | 
|   2,018 |   57,689 | 

有關數據收集的一些信息,請https://packaging.python.org/guides/analyzing-pypi-package-downloads/

相關問題