目前,有一款遊戲擁有不同的羣組,您可以每小時玩一次「黃金獎」。有時候有黃金,有時候沒有。它每小時在facebook上發佈「group2中的黃金」或「group6中的黃金」,而其他時間由於沒有黃金作爲該小時的獎品而沒有帖子。我想寫一個小腳本,每小時檢查一次該網站,並獲取結果(如果有或沒有金子,以及什麼組),然後顯示給我。我想在Python中編寫它,因爲我正在學習它。這是最好的語言嗎?我怎麼去做這件事?我真正能夠找到的是關於提取鏈接的信息。我不想提取鏈接,只是文本。感謝任何和所有的幫助。我很感激。從網站獲取文本並將其顯示回
0
A
回答
1
檢出urllib2
從網址獲取HTML和BeautifulSoup
/HTMLParser
/etc來解析html。然後,你可以使用類似以此爲出發點的腳本:
import time
import urllib2
import BeautifulSoup
import HTMLParser
def getSource(url, postdata):
source = ""
req = urllib2.Request(url, postdata)
try:
sock = urllib2.urlopen(req)
except urllib2.URLError, exc:
# handle the error..
pass
else:
source = sock.read()
finally:
try:
sock.close()
except:
pass
return source
def parseSource(source):
pass
# parse source with BeautifulSoup/HTMLParser, or here...
def main():
last_run = 0
while True:
t1 = time.time()
# check if 1 hour has passed since last_run
if t1 - last_run >= 3600:
source = getSource("someurl.com", "user=me&blah=foo")
last_run = time.time()
parseSource(source)
else:
# sleep for 60 seconds and check time again.
time.sleep(60)
return 0
if __name__ == "__main__":
sys.exit(main())
這裏是一個很好的文章有關parsing-html-with-python
1
我有類似的東西給你什麼,而是你留下了什麼我的主問題圍繞着。我看着htmlparser和bs,但我不確定如何做一些事情,如if($ posttext == gold)echo「gold in so so so」..看起來像bs處理很多標籤..我想因爲facebook的帖子可以使用各種標籤,我將如何去做只是對文本的搜索,並返回'後'?
相關問題
- 1. 從一個網站獲取數據並將其顯示在另一個網站
- 2. 從網站獲取文本並將其放入一行?
- 3. 從文本區域獲取輸入並將其回顯
- 4. 從網站獲取文本
- 5. 如何從網站獲取特定信息並將其顯示在框中?
- 6. 如何從網站上抓取圖片並將其顯示在html文件中?
- 7. 只從Wordpress網站獲取文本,在iOS應用上顯示
- 8. 如何從其他網頁獲取圖片並在我的網站上顯示
- 9. Sweetalert - 獲取div內容並將其顯示爲文本
- 10. 如何從圖片託管網站獲取專輯圖片並自動將其顯示在網站上
- 11. 通過ID從另一頁/網站上的div獲取內容並將其顯示在我的網站上
- 12. 從網址獲取文本並顯示它(幾乎可行)
- 13. 從網站收集特定信息並將其顯示在我的網站上
- 14. 將Xml解析爲本地文件並將其顯示爲回收站視圖
- 15. 如何從遠程文本文件提取數據並將其顯示在我的網站上?
- 16. 拉一個網站的網站文字,並將其顯示在另一個
- 17. 從其他網站獲取數據並顯示在我們的頁面中。
- 18. 通過API調用從網站獲取網站並向用戶顯示
- 19. 從網站獲取圖像列表並顯示它
- 20. vb.net從web.txt文件中讀取文本並將其顯示在文本框中?
- 21. 如何從數組中獲取項目並將其顯示在文本框中;
- 22. 如何從JSON獲取價值並將其顯示在文本框中?
- 23. 從網站獲取JSON文本
- 24. Python - 從報紙網站獲取文本
- 25. 用VBA從網站獲取文本
- 26. 使用JSoup從網站獲取文本
- 27. 從警報獲取文本在網站
- 28. 從短信中讀取文本,並將其顯示爲文本視圖
- 29. 從文本框中獲取文本並將其放入javascript中
- 30. 從其他網站獲取文本以便在html中使用
另請參閱:lxml.html – Lionel