我正在研究一些網頁挖掘的東西,並試圖找到某些特定實體的網頁URL(例如,維基百科頁面和主頁)。由實體我的意思是一些球員的名字,位置等。例如,如果我的輸入是貝克漢姆,我想以下的輸出:如何爲任何給定實體找到網址和圖片?
網址結果:
http://en.wikipedia.org/wiki/David_Beckham
和圖像結果如:
http://upload.wikimedia.org/wikipedia/commons/2/21/WikiBex.jpg
可有人請點出任何方法來實現這一目標?
不用編寫搜索引擎,dbpedia spotlight就可以用來解決這個問題。 – Skandh 2012-08-03 04:09:15