2008-10-18 206 views
4

有沒有人有使用網絡查詢語言的經驗?適用於網絡的SQL

我正在尋找項目,商業或沒有,做了一個很好的工作,使網頁查詢,甚至後面的鏈接來聚合從一堆頁面的信息。

我會優先考慮sql或linq語法。我當然可以下載一個網頁,並開始做一些XPATH,但我尋找一個有很好抽象的解決方案。

我發現的WebSQL

http://www.cs.utoronto.ca/~websql/

這看起來不錯,但我不爲Java

SELECT a.label 
FROM Anchor a SUCH THAT base = "http://www.SomeDoc.html" 
WHERE a.href CONTAINS ".ps.Z"; 

是否有其他人在那裏?

是否有可用於.NET語言的庫?

回答

0

我不確定這是不是你正在尋找,但Freebase是一個開放的數據庫信息與程序化查詢接口。

1

您可能在尋找SPARQL。它不允許您解析頁面,但它旨在解決相同的問題(即從網站獲取數據 - 從雲端)。這是一個W3C標準,但很不幸,微軟顯然還不支持它。

3

參見hpricot(Ruby庫)。

# load the RedHanded home page 
doc = Hpricot(open("http://redhanded.hobix.com/index.html")) 
# change the CSS class on links 
(doc/"span.entryPermalink").set("class", "newLinks") 
# remove the sidebar 
(doc/"#sidebar").remove 
# print the altered HTML 
puts doc 

它支持使用CSS或XPath選擇器進行查詢。

相關問題