2009-08-14 31 views
0

當您在Facebook或Digg上分享內容時,它會生成頁面摘要。我將如何在Perl中執行此操作?有哪些算法?如何使用Perl創建網站摘要?

例如:

如果我去Facebook和我分享這個問題作爲一個鏈接: How can I create a website summary with Perl?

它檢索「?Facebook的/ Digg的獲得網站總結 - 堆棧溢出」作爲標題(

+2

你能解釋一下你在更詳細尋找一種總結的? – Mark 2009-08-14 19:59:51

回答

1

基本上要刮URL並找到「最顯著款」,這可能是第<DIV>或<p> ELEM這是頁面的只是標題)和[...不完整的問題嗎?]在第一個<h2>或<h1>之後,取決於頁面的佈局。

1

您可以檢查並查看頁面上是否存在元描述,但這會讓您置疑寫元描述的人。

+0

我試圖做到這一點,但大多數文章不包含它們。 – Timmy 2009-08-14 20:03:18

2

假設你的意思共享一個鏈接...

通常彙總由用戶提交的URL寫。

  • 使用文檔正文的前100個左右的字符(本身不容易)
  • 使用元數據,如描述或關鍵字(通常是空的:如果你必須寫一個總結自動地這可以通過實現或發送垃圾郵件)
  • 上下文相關的摘要,recreating Google snippets(對不起它的PHP,但簡單)
  • 標籤/使用類似的Yahoo Keyword Extractor API或您自己的關鍵字密度函數從該文檔的關鍵字

你最好打賭就是問問用戶!

希望幫助有些:)