Q
使用sed
1
A
回答
1
與awk
試試:
$ cat file
<div class="name-ad hidden" data-count="91">
<div class="name-data-item" data-name="**I NEED TO SCRAPE THIS**" data-
count="92">
<div class="name-data-name">Washington NH</div>
<div class="name-data-location">Sullivan, Washington,
NH<br></div><div class="name-data-status">**I NEED TO
SCRAPE THIS AS WELL**</div> </div>
$ awk -F\" '/name-data-item/ {print $4}' file
**I NEED TO SCRAPE THIS**
+0
你錯過了'**我需要 這是好的**'' –
+0
'awk -F \''/ name-data-(item | status)/ {print $ 4}'file'應該可以解決這兩個問題。 –
1
隨着xmlstarlet
,這更vaild HTML(file.html):
<html>
<body>
<div class="name-ad hidden" data-count="91">
<div class="name-data-item" data-name="**I NEED TO SCRAPE THIS**" data-count="92">
<div class="name-data-name">Washington NH</div>
<div class="name-data-location">Sullivan, Washington, NH<br /></div>
<div class="name-data-status">**I NEED TO SCRAPE THIS AS WELL**</div>
</div>
</div>
</body>
</html>
命令:
xmlstarlet sel --html -t \
-v "//html/body/div/div/@data-name" \
-v "//html/body/div/div/div[@class='name-data-status']" file.html
輸出:
**I NEED TO SCRAPE THIS****I NEED TO SCRAPE THIS AS WELL**
或以新行:
xmlstarlet sel --html -t \
-v "//html/body/div/div/@data-name" \
-n \
-v "//html/body/div/div/div[@class='name-data-status']" file.html
輸出:
**I NEED TO SCRAPE THIS** **I NEED TO SCRAPE THIS AS WELL**
相關問題
- 1. 使用SED
- 2. 使用SED
- 3. 使用sed
- 4. 使用SED
- 5. 'sed的' 使用
- 6. 使用sed/awk/
- 7. 使用SED
- 8. 使用SED
- 9. 使用SED
- 10. 使用sed
- 11. URL使用sed
- 12. 使用SED
- 13. 使用sed -e
- 14. 使用SED
- 15. 使用SED
- 16. 使用SED
- 17. 使用SED
- 18. 使用SED
- 19. 使用sed
- 20. 使用SED
- 21. 使用SED串
- 22. 使用sed
- 23. 使用awk,sed
- 24. 多個sed和sed使用管道
- 25. 如何使用SED
- 26. 使用sed命令
- 27. 擦除使用sed
- 28. 如何使用SED
- 29. 移動使用SED
- 30. 如何使用SED
我建議使用XML/HTML解析器(xmlstarlet,xmllint ...)。 – Cyrus
您的代碼段無效。請,你可以發佈有效的輸入嗎? –