由於必須從結構根本無法預測的小型字符串中提取程序標題,導致出現問題。有一些模式可以在下面看到,並且每個字符串都必須經過評估,看它是否與任何這些結構相匹配,以便我能夠正確地獲得標題。使用RegEx從字符串中提取標題
我已經買了掌握正則表達式,但是我必須做到這一點的時間不允許我學習這本書,並試圖獲得必要的介紹(有趣但很特別)的主題。
Perharps,這方面經驗豐富的人可以幫助我理解如何完成這項工作?
Some random Name 2 - Ep.1
=> Some random Name 2
Some random Name - Ep.1
=> Some random Name
Boff another 2 name! - Ep. 228
=> Boff another 2 name!
Another one & the rest - T1 Ep. 2
=>Another one & the rest
T5 - Ep. 2 Another Name
=> Another Name
T3 - Ep. 3 - One More with an Hyfen
=> One More with an Hyfen
Another one this time with a Date - 02/12/2012
=>Another one this time with a Date
10 Aug 2012 - Some Other 2 - Ep. 2
=> Some Other 2
Ep. 93 - Some program name
=> Some Program name
Someother random name - Epis. 1 e 2
=> Someother random name
The Last one with something inside parenthesis (V.O.)
=> The Last one with something inside parenthesis
正如你可以看到從A-ZA-Z,我想從給定的字符串中提取可能有數字,特殊字符,如&的標題和文字(我想這是所有)
的複雜的部分來時,必須知道它是否有一個空格或更多的標題後面跟一個連字符,如果它有零或更多的空間,直到Ep。 (我無法解釋這一點,它只是複雜)
這可能是不可能的;畢竟,你試圖提取的電影標題(我假設那些是電視劇)可能和它們文件名的格式一樣瘋狂。有時,即使是一個人也可能難以從這些電影中提取標題。假設你有'300 - 01'這樣的東西:顯然標題是300,而且是01集,或者它真的很明顯嗎? – Nolonar
更何況'星際爭霸1「或」Starwars Ep。 1',在這種情況下,「Episode 1」或「Ep。 1'是標題的一部分... – Nolonar
@Nolonar你是完全正確的!我期望的是在上面的每個模式上測試每個字符串,如果沒有匹配,就忽略程序。我已經在考慮這種情況。 – Lothre1