2015-11-08 75 views
-1

我想從文本文件中提取日期。日期是這樣寫的:字 - 2015年1月5日,字。Python dateutil ValueError:未知字符串格式

from dateutil import parser 

content = "" 

data = open("some_doc.txt", "r") 
for line in data: 
    content = content + line 
content = str(content) # I don´t think that this is necessary but just to be sure 

d = parser.parse("content", fuzzy = True) 

這段代碼總是給我以下錯誤:

Traceback (most recent call last): 
    File "C:/", line 16, in <module> 
    parser.parse(content, fuzzy = True) 
    File "C:\", line 698, in parse 
    return DEFAULTPARSER.parse(timestr, **kwargs) 
    File "C:\", line 304, in parse 
    raise ValueError("unknown string format") 
ValueError: unknown string format 

是否有人知道我應該改變或具有這種格式提取日期另一種解決方案?

+0

它不是我試過這個,但我得到了相同的錯誤 – marvin1849

+0

該文件中是否有多個日期?如果是這樣,也許你想解析每一行?我認爲你看到了問題,因爲你正在用內容一次解析多個日期。我還假設你的意思parser.parse(內容,模糊=真),而不是「內容」? – pcm

回答

0

你可以做的是用正則表達式解析內容,然後使用dateutils的解析。

分享該文件的內容以幫助您更好。

PD:對不起,我的英語。

問候。

0

我認爲你可以把解析放在for循環中,而不是之後的'content',因爲如果多個日期不同,parse()不起作用。

這將解析文件的每一行,並從行中獲取日期(假定您的文件中包含大於1的日期)。

相關問題