2016-05-07 115 views
2

有什麼區別XML中的<seg>和HTML中的<span>有什麼區別?這裏有兩個通道從聖經,一個從Christodouloupoulos' and Steedman's massively parallel Bible corpusEnglish Bible'<seg>`和`<span>`

<?xml version="1.0" ?> 
<cesDoc version="4"> 
    … 
    <text> 
     <body id="Bible" lang="en"> 
      <div id="b.GEN" type="book"> 
       <div id="b.GEN.1" type="chapter"> 
        <seg id="b.GEN.1.1" type="verse"> 
         In the beginning God created the heaven and the earth. 
        </seg> 
        <seg id="b.GEN.1.2" type="verse"> 
         And the earth was without form, and void; and darkness was upon the face of the deep. And the Spirit of God moved upon the face of the waters. 
        </seg> 
        … 

,另一個從和合譯本在Bible Gateway,這是他們從哪裏得到他們的大部分文章來自:

<p class="chapter-1"> 
    <span id="en-NIV-27932" class="text Rom-1-1"> 
     <span class="chapternum">1&nbsp;</span> 
     Paul, a servant of Christ Jesus, called to be an apostle and set apart for the gospel of God— 
    </span> 
    <span id="en-NIV-27933" class="text Rom-1-2"> 
     <sup class="versenum">2&nbsp;</sup>the gospel he promised beforehand through his prophets in the Holy Scriptures 
    </span> 
    … 

在HTML中,似乎<span>可以代替<seg>,但HTML添加了<span>中的經文編號。哦,章節在<div>。所以這不是一對一的。

當然,我意識到HTML和XML是不同的,這只是一個並置;我確定有其他人在那裏。但是我將需要能夠將XML顯示爲HTML,並且我不希望憤怒於神。那麼,在概念上,<seg><span>有什麼不同,用途,意義和用法?

更新:@ jim-garrison,說我需要閱讀模式來理解XML,但我也是一位新手。特別是,TEI爲<seg>找到了一些official-looking documentation,這讓我覺得它的使用比任意的要多一點,但我不知道如何解釋這個文檔。它應該給我們一個比Jim已經寫的更具體的答案嗎?

回答

3

XML和HTML的區別通常是標籤可以存在於XML的列表由DTD或XML模式定義的,並且標籤表示文件語義和不呈現。所以標籤可以被命名任何東西。在HTML中,標記集通常是預定義的,就像存在預先存在的HTML DTD或模式,但HTML不是 XML,並且不遵循XML的所有規則。雖然HTML在某種意義上來源於與XML(SGML)相同的父代,並且這兩者表面上非常相似,但它們絕對不是同一個東西。

對於您的具體問題的答案是,XML的編寫者選擇使用名爲<seg>(「segment」?)的標記來表示廣義字符串,其中屬性提供額外的語義信息。有關更多詳細信息,您需要找到管理XML內容的DTD或XML模式,並閱讀隨附的文檔。

但是我需要能夠將XML顯示爲HTML,並且我不想憤怒doctype gods。因此,從概念上講,與目的,含義和用法有什麼不同?

在這裏,您將使用XSLT轉換輸入XML轉換成有效的HTML。要弄清楚如何進行這種轉換,您需要知道所有可能出現的標記的完整語義(再次參閱DTD/Schema的文檔),並決定數據的可視表示。沒有人回答「<seg>」應該如何轉化。這取決於您對演示文稿的要求。一種可能的轉換將<seg>標籤轉換爲<span>,但這可能取決於某些屬性的值(type="verse" vs某些其他類型)。它可能甚至會根據輸出媒介(桌面和平板電腦vs手機vs手錶vs vs ...?)而有所不同(

一旦您從XML轉換爲HTML,您已經離開了Doctype gods的領域,並且他們對您的東西沒有興趣做:-)有一個完全不同的神像,比如CSS-Cthulhu,Javascript-Janai'ngo(查看它)等等,他們會非常高興地讓你的生活變得悲慘。