2012-06-04 45 views
0

當在Facebook上分享一篇文章時,Facebook會生成一個標題,抽象並將圖像附加到共享文章。facebook如何提取共享鏈接(文章)的摘要?

例如,把www.stackoverflow.com在您的狀態將geenrate

堆棧溢出 https://stackoverflow.com/ 這是一個協作編輯的問答網站專業和發燒級的程序員。它是100%免費的,無需註冊。

(其中順便說一句:是不是在stackoverflow.com頁面的源代碼)

但是,試圖像在新聞網站的文章的時候,我們從網頁的源代碼得到一些提取出的結果(檢查任何物品在www.goal.com例如)..

任何關於算法Facebook使用的想法?

+2

嘗試註銷並查看源代碼:'

這是專業和發燒友程序員的協作編輯的問答網站。它是100%免費的,無需註冊。

'在裏面。 – amit

回答

1

Facebook用來顯示鏈接的元數據總是從html源代碼中提取。

正如@amit所說,描述存在於源代碼中,標題是從標題標記中提取的。
您可以看到Facebook正在抱怨,但是如果您在debugger中檢查了該網址。
如果您點擊頁面上的最後一個鏈接(See exactly what our scraper sees for your URL),您可以看到fb scrapper正在收到的響應。

此源有時可能與您在瀏覽器中獲得的內容不同(儘管不是這種情況),因爲某些網站檢查用戶代理字符串,如果它是fb scrapper(facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)),則返回不同的響應。