2013-01-02 38 views
0

我工作的論壇軟件,並希望利用HTML5和微數據(新的微觀數據)。我正在考慮將詞彙添加到軟件本身,而不是鏈接到模式或數據詞彙表,或其他。微觀數據和詞彙

再說,我想知道的影響,這可能會對服務器的性能,通過所有那些蜘蛛爬行的詞彙被擊中。

你對此有何看法?

+0

*爲什麼*你想創建一個新的詞彙?關於語義網的全部觀點是使用*共享*詞彙表。只有當現有詞彙表與您的內容不匹配時,纔會創建新的詞彙表。另外,我敢打賭你不會注意到任何性能影響,因爲幾乎沒有人會抓取這些URI。 – unor

+0

這正是爲什麼,因爲它沒有被定義。爲什麼他們不會抓取詞彙? – Xarcell

+0

抓取工具在那裏找到什麼?我對微數據不熟悉,但至少在RDFa中,您不必在這些URI處提供任何內容。他們是標識符。如果bot解析RDFa /微數據並找到一個已知的URI(如schema.org),則不需要遵循它。如果它發現一個未知的URI,沒有必要遵循它,因爲它可能只爲人類找到文檔。如果你提供機器可讀的元數據*關於這些URI的詞彙表(這將是好的,我猜),它可能對機器人很有用。但我敢打賭,幾乎沒有機器人在尋找它。 – unor

回答

0

如果沒有(流行)現有可用於您應該只創建一個新的詞彙。

Dublin CoreFOAFSIOC是幾乎每個論壇都可以使用的流行的。但是,我不確定這些數據是否可以與微數據一起使用(我想這應該是可能的,但我不太瞭解微數據)。但他們使用RDFa,這與微數據和W3C推薦(如HTML)非常相似。 RDFa can be used in HTML5。如果您是RDF的新手,您可能首先需要使用RDFa Lite(它具有預定義的DC,FOAF和schema.org詞彙表的前綴)。

我想知道這可能有服務器性能的影響,被所有蜘蛛抓取詞彙表擊中。

我不認爲有很多(如果有的話),微觀數據的抓取工具會嘗試訪問詞彙的URI。在大多數情況下,他們不會找到他們可以使用的任何內容,因爲詞彙URI在大多數情況下只能作爲標識符。即使這樣的爬蟲出現了,你幾乎不會注意到任何性能影響,因爲他們可能會緩存它。