1
我有一個文本數據列表,我想從中提取某些部分。我目前使用正則表達式來提取我想要的數據,但由於每條記錄稍有不同,它開始變得非常複雜。有沒有一種方法可以使用Rapidminer根據一些典型示例「學習」正則表達式?使用rapidminer來獲取文本信息
例如,對於以下每個記錄我想提取文本24
和18
成兩個新的屬性:
word 24 on line 18
Wrd 24 of Ln 18
Line 18, Word 24
Word 24 comes after word 22 on line 18 (not line 19)
我看過所有的文字處理視頻,但他們沒有說明如何做這種事情,我真的不知道從哪裏開始。任何人都可以提出一個方法,而不是手動創建正則表達式嗎?