2016-11-22 23 views
0

我正在尋找解析出版權持有人和'Inc'是否存在各種各樣搞亂版權的版權註釋。如果版權包含日期,我有一個正則表達式,但我正在努力想出一些可以處理這兩種情況的東西。使用正則表達式解析版權持有者信息

這裏有幾樣:

# Copyright:: 2013-2016 MyCorp, Inc. 
# Copyright:: 2013-2016 MyCorp Inc. 
# Copyright:: 2013-2016 MyCorp Inc. 
# Copyright:: 2009-2010 2013-2016 MyCorp Inc. 
# Copyright:: MyCorp Inc. 
# Copyright:: John Doe 

下面是我用的是什麼含版權日期和公司如何有選擇地匹配「公司」,而忽略了周圍的任何建議和。如果存在。

[0-9]{4}(?!.*[0-9]{4})(.*)(?:,)? (Inc)(?:.)? 
+0

在最後一個例子,你會想匹配李四? –

回答

0

我似乎是從一個簡單的正則表達式不甚至使用向前看符號獲得相當不錯的里程:

^# Copyright::(?: (?:\d{4}-\d{4}))* (.*)$ 

這將匹配而來的可選範圍一年後的一切,它應該發生。

演示在這裏:

Regex101