我有一個包含數據的46 MB csv文件。從本質上講,我只想選擇那些具有特殊字詞的行,比如「PRODUCT」。這個數據有600 000行。我用grep()
來搜索字符串匹配。以下是我的數據的幾行。如何從行中提取單詞
head(test)
Item.Description UQC Year
1 PHARMACEUTICALS PRODUCTS.(MEDICINE) DOLEYKA SYRUP 100 ML NOS 2015
2 Multani mati hesh100gm x 160 (AyurvedicProducts) PAC 2015
3 Amla /Shikakai/ Aritha powder 100gm x 160 (Ayurvedic Products) PAC 2015
4 Godrej h.dye blk 40ml x 36 (Ayurvedic Products) PAC 2015
5 DR. COOLERS HERBAL LOZENGES.(2) DR. COOLERS HERBAL LOZENGES (MINT FLAVOUR) PAC 2015
6 Eno lemon/ regular 100gm x 48 (AyurvedicProducts) PAC 2015
Identifier RITC.Code
30049099
30049011
30049011
30049011
30049011
30049011
我已經使用test[grep("PRODUCT", rownames(test)), ]
。它給了我一個錯誤。
你有「產品」在'rownames'看起來它是在'Item.Description'列。即試試'[grep(「PRODUCT」,test $ Item.Description)]' – akrun