ScavengerHadoop作业监视器、杀手与报告器
项目介绍与使用说明文档(中文):
使用背景: 在 Hadoop 集群中,多个 Job 会并行运行,这些 Job 可能来源于 MR 脚本、Hive SQL 或 Pig 脚本 等。如果集群没有有效管理这些 Job,一些 Mapper 数量过大的 Job 会占用过多资源,从而导致其他 Job 的阻塞。最初,团队通过手动查看 JobTracker (50030) 并人工 kill 进程来解决问题,但这一方法效率低下且不够智能。因此,设计了本项目来自动化监控 JobTracker 上的 Job,如果某个 Job 超过设定的最大 Mapper 数量 或运行时间,系统会自动 kill 该 Job,并发送 邮件报告。
层级目录:
|____common
| |__init.pyc
| |____commom.pyc
| |____jobutil.py
| |____jobut
下载地址
用户评论