0
維基百科將所有信息存儲在服務器中,並且頁面由PHP提供。有沒有一種可能的方式來下載和存儲維基百科內容,而不需要實際瀏覽網站。這樣,我可以節省時間和存儲空間,並在以後處理抓取的數據。獲取維基百科的鏡像,但不實際存儲html
P.S.我知道問題的提法很糟糕,但希望你明白我的意思。
維基百科將所有信息存儲在服務器中,並且頁面由PHP提供。有沒有一種可能的方式來下載和存儲維基百科內容,而不需要實際瀏覽網站。這樣,我可以節省時間和存儲空間,並在以後處理抓取的數據。獲取維基百科的鏡像,但不實際存儲html
P.S.我知道問題的提法很糟糕,但希望你明白我的意思。
是的,你可以下載各種SQL/XML轉儲。這裏有完整的註釋:Wikipedia:Database download