2013-06-11 34 views
2

我需要在CNN網站的每個新聞頁面中獲取用戶評論,該網站使用評論系統。我已經使用進行html解析。是否有任何特定的代碼,我可以使用它來提取註釋作者和評論使用。除非該網站使他們有使用c提取企業網站評論#

由於提前, Dinusha

+0

有你,你嘗試過自己的任何代碼?如果你有一個你會介意發佈它? – Edper

+0

我目前沒有任何代碼。我聽說Disqus SHARP。但是爲了嘗試一些代碼,我找不到任何示例。 – user2475467

回答

3

由於Disqus嵌入是一個JavaScript嵌入,該意見將不會在頁面的源代碼可用。如果您正在抓取頁面並讓JavaScript呈現,那麼可以在「postCompatContainer」DIV內的Disqus iFrame中找到第一頁(最多50條評論)。

但是,我會建議使用Disqus API來完成此操作。有兩個主要部分是這樣的:

  1. 從文章中獲取線程信息

具體表現在頁面的源代碼,你必須要找到變量「disqus_shortname」和「disqus_identifier」或「disqus_url」 。如果'disqus_identifier'或'disqus_url'不可用,那麼您可以嘗試使用窗口位置地址,但這不太可靠。

  1. 使用該數據進行API調用。

具體來說,你需要使用我們的threads/listPosts端點傳遞「disqus_shortname」爲「論壇」和標識符或網址爲「線程= IDENT:」或「線程=鏈接:」來進行。

我不會進入這裏使用API​​的細節,但我們這裏有一個很好的入門教程:http://help.disqus.com/customer/portal/articles/1131783-tutorial-get-comment-counts-with-the-api

和更多的例子在這裏:https://github.com/disqus/DISQUS-API-Recipes

+0

嗨瑞安,非常感謝你的回覆。我對這個API非常陌生。我們可以使用DisqusSharp來達到這個目的嗎?如果可能的話,請在c#中提供一個小樣本代碼。所以我可以用它開始我的代碼。 – user2475467

+0

DisqusSharp看起來不受支持,它使用我們的舊API。這是一個適用於Windows Phone的C#示例,因此您可能需要對其進行一些修改:https://gist.github.com/ryanvalentin/5767814 –

+0

嗨,Ryan,非常感謝您的示例代碼。我可以用這個開始我的代碼。我開發了一個Windows窗體應用程序來提取新聞文章以及評論。除了CNN之外,我還需要從幾個網站中提取評論。當獲得API密鑰時,我應該在申請表格中爲「網站」(您的申請的網站)提供哪些信息?我是否必須爲我訪問的所有網站獲取單獨的密鑰? – user2475467

相關問題