2013-06-18 45 views
-1

我正在研究一個語言學項目,我需要在其中搜索文本中的模式。我需要搜索以下模式:„ blah blah blah **target word** blah blah"。換言之,(德語)引號內包含的特定單詞的實例在引號之間可以有任意數量的其他單詞。紅寶石常規expressios正確的路要走嗎?

我使用的軟件說它是用Ruby編寫的,它使用正則表達式進行匹配。我需要知道他們是否是正確的工具。這是Ruby正則表達式可以捕獲的模式嗎?

+1

ruby​​正則表達式的風格有一些額外的曲折,但你會發現一個很好的概述,可以使用正則表達式在http://www.regular-expressions.info –

+0

剛剛發現了這一點。優秀的資源。 –

+0

您的結束標記不是印刷引號('''),而是直引號(''')。 – Stefan

回答

1

簡單。鑑於你在target_word有一個字符串,下面會做。

/\„.*?#{target_word}.*?\"/m 

雖然您可能需要特別考慮德語引號。

+0

謝謝,這是一個好的開始(德國報價給我帶來了麻煩,正如預測的那樣)我現在試着弄清楚其餘的事情,我知道這是可能的,歡呼聲。 –

0

這聽起來像你確實需要的正則表達式或tokenization

我會用後者去,如果你有編程的經驗,正則表達式是相當難掌握。

+0

正則表達式被軟件接受使用這就是我在這裏結束的方式 –