TextGrid是Praat程序使用的「分段」文件。我想寫一個解析器,然後驗證數據。我的問題是:如何解析此格式(Praat TextGrid)
你會如何爲這種格式編寫解析器?一行一行地閱讀它或別的東西?這是一個已知的格式?
File type = "ooTextFile"
Object class = "TextGrid"
xmin = 0
xmax = 93.0538775510204
tiers? <exists>
size = 3
item []:
item [1]:
class = "IntervalTier"
name = "diph"
xmin = 0
xmax = 93.0538775510204
intervals: size = 65
intervals [1]:
xmin = 0
xmax = 1.300090702947846
text = ""
intervals [2]:
xmin = 1.300090702947846
xmax = 1.5300845864661654
text = "ey_s"
intervals [3]:
xmin = 1.5300845864661654
xmax = 3.4648692624493815
text = ""
(這然後重複到EOF,以間隔[4 .... n])的
我會在整個JSON規範的頭部擊中該格式的作者。不幸的是,規範只是一個頁面。 – phihag 2011-05-29 12:10:18
@marw我不知道格式,但它看起來很自定義。你能舉一個反斜槓,引號和換行符如何存儲的例子嗎?如果是這樣,編寫解析器非常簡單。 – phihag 2011-05-29 12:13:54
那麼,谷歌讓我:)解析器存在於NLTK:http://nltk.googlecode.com/svn/trunk/nltk_contrib/nltk_contrib/textgrid.py感謝您的意見!如果上述失敗,我會重新打開。 – marw 2011-05-29 12:29:45