2015-05-14 70 views
1

使用simple_html_dom將其他網站內容廢棄到我的網站中是否正確。如果它是錯誤的,建議我在我的網站上顯示新聞的方法是什麼。使用html dom解析器廢棄

+0

嗯... RSS提要? API? – odedta

+0

我不知道這件事。請指導我如何運作? –

+1

我其實從來沒有嘗試過RSS源,所以我不能在那裏得到太多的幫助,但是,它不應該是複雜的,因爲w3schools教程是相當簡短和直接。 http://www.w3schools.com/webservices/rss_intro.asp 至於API,它是應用程序接口,我的意思是你可以檢查該網站,如果他們已經爲像你這樣的開發者提供了某種接口,通過使用某些功能從他們的網站撤消新聞。 – odedta

回答

1

simple_html_dom是我猜測的一些擴展。如果你正在尋找核心PHP(PHP擴展)的東西,使用DOMDocument

基本上通過刮你正在採取的網站內容。如果你對他們(站點球隊)的同意做同樣的話,那麼它是可以的,否則它不合法(取決於他們的T & C)。也有網站有機制阻止此類行爲。

更好地問網站團隊的內容,他們可能能夠以更好更簡單的方式提供數據。像API,RSS或直接Database

+0

如果您在公開(即沒有代理)的情況下進行爬網,並且擁有可識別的用戶代理字符串,並且不會超載刮取目標,那麼搜索引擎就是這樣做的,並且在大多數轄區內都可以。但是,根據作者的態度(例如搜索引擎OK,價格比較網站),重新發布數據有時會被視爲版權違規。 – halfer

+0

請注意,法律不是由條款和條件創建的,幸好法律是由立法者創建的。條款與條件試圖將用戶綁定到他們尚未簽署的合同中,以及綁定的方式可能取決於相關國家/地區。通常反對刮蹭的網站(例如大型消費者拍賣網站)會發出嚴厲的法律函件,這對於在法庭上進行挑戰來說太昂貴了。建立一個不依賴於一個站點的刮板服務是非常好的建議! – halfer

+0

完全同意。 :) – Jigar