我正在分析skype截圖。目前的任務是從可用聊天截圖中瞭解誰在當前對話中以及在什麼時間說什麼。通過分析skype截圖,找出誰開始對話 - python
如果我只是在圖像上運行一個ocr引擎,它給我沒有價值,因爲誰說什麼從可用文本。
img = requests.get(url)
if img.status_code == 200:
img = Image.open(StringIO(img.content))
img = process_image(img)
img = img.resize((int(img.size[0] * 2), int(img.size[1] * 2)),Image.ANTIALIAS)
text = pytesseract.image_to_string(img)
文字在這裏只是給我從Skype窗口中的所有文本內容,但我無法確定是誰的話。
唯一突出鮮明的細節觀察到的是,我的消息以藍色矩形高亮顯示,我收到的有灰色。
如何識別誰發送,什麼消息以及在什麼時間?
要多一點點感覺,爲什麼我這樣做;我進一步計劃分析從截圖中提取的文本,並將其分類爲兩種不同類型的對話(無論我是開始對話還是其他人)。
例如: - 如果這是Skype的截圖: https://drive.google.com/open?id=0B-oewG7CW8ozTWx4U280bEFqY1E
根據最後的消息和時間戳,我送它開始了談話的消息。
對於這個其他例子: - 如果這是截圖 https://drive.google.com/open?id=0B-oewG7CW8ozaE1kS3dKUU4wMHc
其他人開始對話。
[編輯]:我真的很抱歉,我忘了提,我沒有獲得Skype的聊天記錄。我只需要分析一大堆skype截圖。
Skype不會將聊天記錄作爲文本文件以某種方式存儲在計算機上嗎?我不確定它們使用的格式是什麼樣的,但是您可以打開文本文件,看看是否可以解析它以獲取該信息。就像我說的,我不是100%確定這是否能得到你想要的,但它只是一個想到的想法。 – Harrison
你寫了什麼代碼,以及哪裏_specifically_卡住了? – 2016-08-24 13:30:45
至少Linux skype將消息存儲在sqlite3數據庫中 - 你甚至不需要OCR。 –