我試圖產生以下... 輸入 396124436476092416,「想想你活着的生活,但不要覺得這麼難受它傷害生命是一種真正的禮物,但在同樣它是一種詛咒「 Obey_Jony09 396124440112951296,‘00:00 #MAW’,WesleyBitton如何忽略數據字段中的「,」
A = LOAD '/user/root/data/tweets.csv' USING PigStorage(',') as (users:chararray, tweets:chararray);
B = FILTER A by users == '396124436476092416';
輸出截斷 (396124436476092416,」想想你活着的生活,但不覺得那麼辛苦好痛人生真是一份禮物)
輸出除了 (396 124436476092416,「想想你活着的生活,但不要覺得這麼難受它傷害人生真的是一份禮物,但同樣它是一個詛咒」)
我不想讀行作爲行。
感謝您的想法,改變了 「」 到 「|」 過濾之前的作品。與傳統系統相比,引擎對檢查這些驗證功能的數據沒有額外的價值。 –