2014-11-24 10 views
0

正則表達式我有我的正則表達式這裏C#
提高我校對

(".*?"|「.*?」|「.*'|'*.") 

我也嘗試這種模式

("|'|「).*?("|'|」) 

,但它沒有給出結果,我想

下面是示例段落
「Lorem」Ipsum簡直就是印刷和排版的虛擬文本傳譯。自從16世紀以來,「Lorem Ipsum」一直是業界標準的虛擬文本,當時一臺未知的打印機採用了一種類型的廚房,並將其製作成樣本書。它不僅存活了「五個世紀」,而且還實現了電子排版的飛躍,基本保持不變。它在20世紀60年代隨着包含Lorem Ipsum段落的Letraset表單以及最近的「桌面出版」軟件(如「Aldus」,「PageMaker」,包括Lorem Ipsum的版本)的發佈而普及。

我在這裏的目標是獲得在這些字符內的所有單詞

"", 「」, 「', '", '' 

之所以有人喜歡那,說寫文章的人了,而不是與關閉雙引號一個錯字, - 雙引號,文章作者用單引號關閉它。

眼下,正是我得到的是這種 enter image description here

我預期的輸出是

Lorem, Lorem Ipsum, five centuries, desktop publishing, Aldus, PageMaker 

但不限於,因爲這個表達式將在整篇文章和數百篇文章運行。

這條線在這裏從上面大概是最棘手的部分樣品paragarphy
行業的標準假人文本自1500年,當一個未知的打印機採取了類型的廚房和炒它做一個類型標本的書的。它已存活不僅是「五個百年,也

+0

您的文章沒有明確排除的嵌套報價 - 考慮編輯...或實際考慮嵌套引用過「就像有人說:‘當你使用正則表達式你現在有問題’,這通常是當一個提到「詢問正則表達式」「...還檢查了有關與正則表達式嵌套結構匹配的圖表問題的頂部:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self -contained-tags – 2014-11-24 02:10:27

回答

1
(?:"|'(?!s\b|\s)|「)[^"'「」]+(?:"|'(?!s\b)|」) 

嘗試this.See演示。

http://regex101.com/r/yP3iB0/13

+0

它正在工作,但我得到了一些錯誤。將此添加爲一個新的段落(Lorem Ipsum自從十六世紀以來一直是業界標準的虛擬文本,當一臺未知的打印機將一個「類型的廚房」打亂「製作一個類型」樣本書「) – 2014-11-24 02:37:55

+0

幾乎在那裏。將此添加爲另一個parag(它不僅存活了'五個世紀',而且還有電子排版的飛躍,基本保持不變。) – 2014-11-24 02:54:33

+0

這次不工作。 (?:「|'|」)(?!s \ b | \ s)[^「'」「] +(?:」|'|「)(?!)結果減少 – 2014-11-24 02:58:44