1
我有一個巨大的文件,其中包含大約兩天的轉錄語言的過度長度。我猜想超過100,000個單詞。由python分割帶條件運算符的文本文件
在轉錄過程中,我通過將「< - 名稱 - >」標記分隔爲不同的塊。我的問題是,是否可以自動將它們處理成name_speach.txt命名約定中的文件?
謝謝!!!!
測試用例:
測試用例
<--測試0-->
這個是一段測試內容,a quick fox jumps over a lazy dog.
<——測試1——>
,a quick fox just over 啊 辣子 dog!!?是嗎?
<——測試2——>
這是一段測試用的text,嗯!
<--Test case 3-->
/* sound track lost @153:12.236 -- 153.18.222 */
…
A quick fox jumps over a {lazy|lame} dog.
取決於以及如何格式化您的數據......搞什麼名堂你試過這麼遠嗎? –
@JonClements每個「<-- Name -->」都是分開的一行,整個文檔中沒有其他地方以「< - 」開頭,既不在行的開頭,也不在句子的中間。 –
您能否顯示一些示例文本。 – enginefree