sitemap

    0熱度

    2回答

    我想根據網頁的sitemap.xml創建一個抓取網址的蜘蛛。所以我沒有start_urls。我想確定使用sitemap.xml刮掉哪些網址。 我曾考慮添加方法_parse_sitemap並使用requests和lxml解析它,但它可能是一種矯枉過正。 是否有一些內置方法可以獲得<loc>標籤中的所有url? 我迄今所做的: 蜘蛛得到一個URL和meta = {'sitemap':True}如此分析

    0熱度

    1回答

    我試圖unmarshall給出的XML文件,結合這些文件的一些信息,並編組他們再次,以便我可以生成一個單一的XML文件。但現在我有一個問題瓦特/我的代碼,因爲我不得不空間聲明由「http://www.google.com/schemas/sitemap/0.9」更改爲「http://www.sitemaps.org/schemas/sitemap/0.9」 之前,我不得不改變這一點,一切是正確的,

    0熱度

    1回答

    我正在嘗試爲ASP.NET MVC Web應用程序創建動態XML站點地圖。基於通過實體框架6模型從數據庫檢索的數據,頁面是結構化和可預測的。我想簡單地使用XML文字從數據庫中檢索每個項目,有點像發生了什麼here。 我的發言如下所示: Dim xmlSitemap = <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="htt

    -1熱度

    1回答

    我想在wordpress上創建sitemap.xml。如何像這樣創建的sitemap.xml: <urlset xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"><url><loc>

    0熱度

    1回答

    在Django視圖以下代碼: def sitemap(request): return render(request, 'sitemap.xml', content_type = 'text/xml') 產生以下錯誤: 異常類型:UnicodeDecodeError錯誤 異常值: 'UTF8' 編解碼器不能在位置0解碼字節0xff:無效起始字節 我該如何解決這個問題?我所要做的就是呈

    -2熱度

    1回答

    我的站點地圖與俄語字母等特殊語言字符鏈接。 我還有問題,只有法國「é」(十六進制代碼點00E9)。谷歌網站管理員工具告訴我,我的站點地圖中有一個404錯誤與此符號的鏈接。它在此符號之後切斷鏈接的一部分。例如:我有一個谷歌的Sitemaps像 example.com/décembre 所以它返回從鏈接 example.com/d 404錯誤怎麼解決避免此類錯誤的鏈接,以及什麼其他符號無效?

    1熱度

    2回答

    我正在爲我的網站創建多個站點地圖文件。問題是我的站點地圖文件位於與我的網站不同的文件服務器上。 例如,我有一個域名網站,www.example.com,但是我的站點地圖索引文件和其他站點地圖文件駐留在www.filestack.com上。 我的站點地圖索引文件看起來像: <sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84"

    0熱度

    1回答

    目前我遇到了爲gatsby-starter-blog生成sitemap.xml的問題。 http://localhost:8000/sitemap.xml仍未找到。 什麼我已經在做: NPM安裝的蓋茨比 - 插件,網站地圖 加入網站元 siteMetadata: { siteUrl: 'http://www.localhost:8000', }, plugins: [

    1熱度

    1回答

    嗨我只想刮掉其日期比特定日期更新的頁面。 例如:如果lastmod是2017/14/9或更新版本,只能刮掉網址。 我使用此代碼來湊所有的頁面,但我不能限制它的基礎上lastmod日期: import requests from scrapy.spiders import SitemapSpider from urllib.parse import urljoin class MySpid

    0熱度

    1回答

    我想定義與操作篩選站點地圖節點,例如: [SitemapUrl(Frequency = Frequency.Monthly, Priority = 0.9)] public ActionResult About() { return View(); } 這將產生如下: <url> <loc>https://www.example.com/home/about</loc