我有3列,一個id列和2個名稱列。有時,2個名稱列的值相同,但其中一列是大寫字母,另一列是小寫字母。我該如何刪除這些值相同(或具有相似字符)但套管不同? 例: 一個=負載txt文件 一個= FOREACH一個生成ID,NAME1,NAME2 電流輸出: id1, james, JAMES
id2, tom, Tom
id3, Jim, Bob
id4, Bill, billy
預期輸出:
我的Python UDF代碼: #commaFormat- format a number with commas, 12345-> 12,345
@outputSchema("numformat:chararray")
def commaFormat(num):
return '{:,}'.format(num)
我的豬腳本: DEFINE CSVExcelStorage or
我試圖產生以下... 輸入 396124436476092416,「想想你活着的生活,但不要覺得這麼難受它傷害生命是一種真正的禮物,但在同樣它是一種詛咒「 Obey_Jony09 396124440112951296,‘00:00 #MAW’,WesleyBitton A = LOAD '/user/root/data/tweets.csv' USING PigStorage(',') as (u
您好我有以下代碼豬: leafNodes = FOREACH records GENERATE
'buckets' AS bucket_url,
MultiConcat(localziedName, ' in ', localizedLocation) AS title,
ToJSONString(
'url', url,
'title', Mu