hive 使用脚本清洗数据:时间戳转日期
2014-08-30 22:52
411 查看
import sys import datetime for line in sys.stdin: line = line.strip() userid, movieid, rating, unixtime = line.split('\t') weekday = datetime.datetime.fromtimestamp(float(unixtime)).isoweekday() print '\t'.join([userid, movieid, rating, str(weekday)])
Use the mapper script:
CREATE TABLE u_data_new ( userid INT, movieid INT, rating INT, weekday INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; add FILE weekday_mapper.py; INSERT OVERWRITE TABLE u_data_new SELECT TRANSFORM (userid, movieid, rating, unixtime) USING 'python weekday_mapper.py' AS (userid, movieid, rating, weekday) FROM u_data; SELECT weekday, COUNT(*) FROM u_data_new GROUP BY weekday;
FROM (
MAP doctext USING 'python wc_mapper.py' AS (word, cnt)
FROM docs
CLUSTER BY word
) a
REDUCE word, cnt USING 'python wc_reduce.py';
相关文章推荐
- MySQL日期数据类型、时间类型使用总结
- at 命令来安排命令、脚本或程序在指定的日期和时间运行。您也可以使用此命令查看现有的计划任务。
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、MySQL时间类型使用总结,需要的朋友可以参考下。【转】
- MySQL:MySQL日期数据类型、MySQL时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、MySQL时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- [转]MySQL:MySQL日期数据类型、MySQL时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- hive 使用streaming 的map 脚本来处理数据
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结
- MySQL日期数据类型、时间类型使用总结