0
A
回答
0
我最終在Python中創建了一個UDF。
from pig_util import outputSchema
from datetime import datetime
date_format = '%Y-%m-%d %H:%M:%S'
@outputSchema('number:is_date')
def is_date(date):
try:
datetime.strptime(date, date_format)
except ValueError:
return 0
return 1
而在豬:
REGISTER 'myudf.py' using jython as udf
raw = load '/path/to/file.csv'
USING PigStorage(',')
AS (id:chararray, consumption_date:chararray);
modified = FOREACH raw
GENERATE id, consumption_month, udf.is_date(consumption_month) as is_date;
bad = FILTER modified BY is_date == 0;
dump bad;
相關問題
- 1. SQL Server - 獲取具有無效日期格式的所有記錄
- 2. 有效記錄:獲取多個範圍的所有日期
- 3. Joda獲取無效格式日期
- 4. 無法獲取所有記錄與日期條件
- 5. 豬日期格式問題
- 6. 日期的格式無效
- 7. 無效的日期格式
- 8. 獲取與最大日期和無效日期的ID的不同記錄
- 9. 如何避免無效日期記錄,其中有給定日期的記錄,否則需要獲得無效日期的記錄
- 10. 日期格式:無效月
- 11. 從日期時間格式的字段中獲取記錄
- 12. 用MAX獲取所有記錄的PLSQL查詢日期
- 13. 獲取從表中的一條記錄,其中記錄是所有日期
- 14. MySQL獲取有記錄但缺少特定記錄的日期
- 15. DB2 - 根據日期獲取所有記錄
- 16. ReadAsStringAsync無法獲取所有記錄
- 17. 無法僅獲取日期格式中的日期?
- 18. 以MM/YYYY格式獲取日期之間的所有月份
- 19. 獲取記錄具有接近日期定輸入日期
- 20. 從有效的gMonthDay格式獲取月份和日期值,無需拆分
- 21. 獲取當年所有星期日日期的公式
- 22. javascript中的無效日期格式
- 23. MySQL的無效日期時間格式
- 24. PostgreSQL的日期格式無效錯誤
- 25. bash中的日期格式無效
- 26. 獲取所有子記錄
- 27. 獲取所有記錄
- 28. Laravel ORM獲取日期間的記錄?
- 29. 獲取記錄的日期範圍
- 30. Mysql獲取特定日期的記錄
你可以把它一步,把你的UDF成UDF 過濾器(Boolean對於outputSchema)。 https://pig.apache.org/docs/r0.16.0/udf.html您將只使用過濾器來獲取您的列表。 – patrungel