如果包裝很受歡迎,即使它的受歡迎程度是另一個流行包裝中某些「導入」情況的原因,也可以很容易地得到一個想法。但是現在由於某種原因我沒有看到這些信息。爲什麼PyPi不再顯示下載統計信息?
一個例子:https://pypi.python.org/pypi/blist
爲什麼他們關閉此有用的東西?
如果包裝很受歡迎,即使它的受歡迎程度是另一個流行包裝中某些「導入」情況的原因,也可以很容易地得到一個想法。但是現在由於某種原因我沒有看到這些信息。爲什麼PyPi不再顯示下載統計信息?
一個例子:https://pypi.python.org/pypi/blist
爲什麼他們關閉此有用的東西?
從this mail.python.org article可以看出,下載統計信息被刪除,因爲他們沒有更新,而且很難修復。
唐納德Stufft,該文章的作者,列出這些原因:
有許多原因,他們的拆卸/折舊其中一些 是:
- 技術上很難做工作,新CDN
- CDN正在捐贈給PSF,並且捐贈的層級不提供任何形式的日誌訪問
- 周圍的工作不具有日誌訪問會大大降低的CDN
- 非常不準確的效用
- 一些東西防止下載次數從不準確,其中一些包括:
- PIP下載緩存
- 內部或非官方的鏡子
- 包未託管PyPI上(用於比較的緣故)
- 鏡像或非官方抓取腳本導致虛高(最後,我看到下載的25%來自已知鏡像 腳本)。
- 不是特別有用
- 僅僅因爲一期工程已經下載了很多,並不意味着它的好
- 同樣僅僅因爲一個項目還沒有被下載了很多不意味着它是壞的
接受的答案是正確的,下載已被禁用,並且Donald Stufft 2013年的電子郵件中的原因很可能仍然非常有效。但自2013年以來,下載已重新啓用,並且僅在最近(〜2016年6月?)才被禁用。在[pypi-legacy issue#396](https://github.com/pypa/pypi-legacy/issues/396#issuecomment-232373133)中可以找到更多細節。 – orbeckst
太棒了!我想知道更多關於這些數據的準確性 – nemesisdesign
@nemesisdesign我相信它每天都會更新。您可以嘗試分析所有19099214行的合法性/準確性。 –
@ kiran.koduru我試過了你的博客文章的指示,但從Google說法表中獲取錯誤消息不存在。這種檢索包元數據的方法仍然有效,或者表名已經改變了? – toske
pypinfo
程序是一個Python3命令行程序,可通過pip安裝BigQuery。如果您設置了憑證(JSON文件),你應該能夠編寫:
$ pypinfo -d 1825 blist year
Served from cache: False
Data processed: 250.31 GiB
Data billed: 250.31 GiB
Estimated cost: $1.23
| download_year | download_count |
| ------------- | -------------- |
| 2,017 | 443,067 |
| 2,016 | 391,816 |
| 2,018 | 57,689 |
有關數據收集的一些信息,請https://packaging.python.org/guides/analyzing-pypi-package-downloads/
我剛剛發佈https://pepy.tech/查看包的下載。我使用了BigQuery的數據,所以你會得到相同的結果:-)
[看起來像惡意下載統計是一個已知的bug已被標記爲'wontfix' - 也許他們因此被刪除?](https: //bitbucket.org/pypa/pypi/issues/396/download-stats-have-stopped-working-again) –