2017-01-05 25 views
1

假設這是一個h1標籤如何使用golang刮取h1標籤的標題?

<h1>FindMe</h1> 
與許多其他H1標籤一個巨大的網頁

,但是這是第一個h1標籤。因此,我使用net/html包,並且在我的程序找到該令牌後,我正在搜索第一個StartTagToken,在這種情況下,如何獲取標題內部寫入的內容即FindMe。

這是我的代碼,現在

z := html.NewTokenizer(body)  

for{ 
    tt := z.Next() 

    if tt= html.ErrorToken{ 
     return 
    } 
    else if tt== html.StartTagToken{ 
     tag := z.Token() 

     if tag.Data =="h1"{ 
      fmt.Println("We found the title\n") 
      //some code to find what is stored in the heading 
     } 
    } 
} 

我如何去這樣做呢?

編輯:更具體地說,什麼是變量標籤的屬性,它會給我裏面的文本。我可能在這裏的概念術語是錯誤的。請與我聯繫

回答

1

你得到的是StartTagToken,你感興趣的部分是在它和相應的EndTagToken之間,因爲​​3210。所以,你需要閱讀下一個標記,它的Data應該是你後的價值,像

... 
if tag.Data =="h1"{ 
    if tt = z.Next(); tt == html.TextToken { 
     fmt.Println(z.Token().Data) 
    } 
} 
+0

謝謝你,這是完美的。 – Krash