2012-03-02 54 views
0

這裏有很多互聯星空類型的網站,比如rapidshare,fileserve,filesonic,wupload等。我很好奇事情是如何在幕後工作的。一旦用戶上傳文件,它是如何存儲的?是否使用某種分佈式文件系統?隨着網站越來越流行,網站的規模如何?很明顯,他們添加了更多的服務器,但負載平衡如何工作?謝謝。Megaupload等網站上的後端如何工作?

回答

1

他們採用的一種技術是文件引用,這是一種隨着它變得更受歡迎而擴展的好方法。基本的概念是,當一個文件被多次上傳時,它只是添加了對第一個原始上傳的引用(即使Dropbox也這樣做)。這實際上是MegaUpload案例中RIAA/MPAA的主要投訴,因爲如果要求取消文件,則只會刪除引用。其他參考文獻和原始文件本身保留,因爲MegaUpload不知道這些文件是否由版權所有者或版權侵權者上傳。

1

使用亞馬遜網絡服務S3是一種方法。您可能對HighScalability中描述的真實世界示例感興趣,如Instagram