2015-12-09 22 views
0

在GSA中使用實體識別時,它只能在網站/文檔的「內容」上工作,還是可以用於提取現有元數據的某些部分?通過對GSA中現有元數據的實體識別提取內容

我有一個元數據,我只想提取匹配正則表達式的元數據內容字段的特定部分。這可能與GSA實體識別有關嗎?或者,也可能是Google Search Appliance內的其他工具。

回答

1

實體識別只能從文檔內容和URL中提取實體。

要清理元數據,你有幾個選擇:

  • 做源回購
  • 使用文檔過濾器或轉換,如果它被連接
  • 使用元數據和網址喂飼料添加新的(消毒)元數據
+0

我想清理一些不良的元數據。例如。 元數據內容'Subject; Cars'。問題是我只想提取「汽車」。但似乎實體認可不允許這樣做。 –

相關問題