2010-03-04 114 views
3

我的網絡應用程序需要訪問任意電子商務商店並確定它是否有產品數據饋送(即Google Base Feed;商店中所有產品的RSS/ATOM Feed)。另外,我需要提取此Feed的位置。自動檢測任意電子商務網站的產品數據Feed?

到目前爲止,我能想到的最佳解決方案是維護給定電子商務平臺的這些Feed的已知位置的綜合列表,並逐個檢查它們,以便當它們返回時將它們從列表中刪除404.

兩個問題:

  1. 你能想到更好的辦法嗎?
  2. 我該如何去生成這個已知產品數據提要位置列表?根據我的經驗,他們通常不公開(不像博客的RSS提要)。

非常感謝! :)

回答

1

你能想到更好的方法嗎?

用戶搜索引擎API來發現供稿。你可以嘗試使用谷歌,Bing和雅虎搜索API來發現你感興趣的領域的產品資訊這可以如下進行:

  1. 列表公共提要格式您有興趣(如谷歌Base,Shopzilla等)
  2. 檢查每個Feed規範中是否可以搜索的唯一字符串。
  3. 工藝搜索API查詢返回相關結果(限制域名,文件類型等)。
  4. 測試您爲產品Feed獲取的鏈接。

很顯然,這假定飼料已被搜索引擎找到並編入索引。

我該如何去生成已知產品數據提要位置列表?

我不認爲產品數據饋送有一個「已知位置」。但是,你可以嘗試,包括你的算法如下模式:

  • URL模式從任何餵你已經瞭解。
  • 你猜對了的URL模式(把自己放在網站管理員的鞋子裏,想想他/她會命名他們)。
  • 查看常用電子商務軟件和產品數據饋送插件的文檔,以確定其默認饋送位置。包含他們的網址格式。
相關問題