测试数据中1表示可回收垃圾,2表示有害垃圾,4表示湿垃圾,8表示干垃圾。
统计数据中各类型垃圾的数量,分别存储可回收垃圾、有害垃圾、湿垃圾和干垃圾的统计结果。 (存储到4个不同文件中,垃圾信息)
(1)统计各类型垃圾数量 需要自定义计数器
(2)分别存储垃圾信息,需要自定义分区
1.通过finalshell 上传到master节点,再使用hdfs命令上传到HDFS文件系统的/bigdata目录下(也可使用Java API 实现上传)
2.创建项目
修改pom.xml文件,添加log4j.properties,拷贝JarUtil工具类
3.编写程序
(1)自定义键的类型 垃圾名称,垃圾分类编号,垃圾分类名称
(2)编写Mapper 并假设计数器
(3)自定义分区
(4)编写Reduce模块以及计数器
(5)编写驱动程序
4.执行看运行结果