CDH 6.3.2 参数调整
1.主机配置
配置项:内存调拨过度验证阈值 推荐配置 0.9 举例:内存64g, (1-0.9)*64=6.4,6.4g 即服务器预留内存 特例:服务器内存不统一,无法进行统一预留,择可以选择分组管理。点击 管理主机覆盖项 ,在选择对应的主机进行分组,更改对应的阈值
详细描述
-
验证主机上的 RAM 分 配时所使用的阈值。
-
0 表示将所有的内存预留给系统使用。
-
1 表示不预留任何内存。其值的变动范围为 0 至 1。
2.HDFS 参数调整
默认参数一般就够用,后面根据具体性能调整即可
3.Hive 参数调整
HiveServer2 最大线程数量 hive.server2.thrift.max.worker.threads
默认 100
调整 200
如果部署HA,可适当调整此参数
搜索 HiveServer2 的 Java 堆栈大小(字节)
调整到 8g
Java 进程堆栈内存的最大大小(以字节为单位)。已传递到 Java -Xmx。
根据业务量和集群资源进行调整
搜索 **自动重启进程
** 勾选
设置后,此角色的进程将在发生意外故障时自动(并以透明方式)重启
添加 jar 包辅助目录:
Hive 辅助 JAR 目录 /usr/share/hive
其他参数可根据后续使用情况调整
4.Yarn 参数调整
搜索 mapreduce.reduce.memory.mb
设置为2g
搜索 mapreduce.map.memory.mb
设置为2g
搜索 yarn.nodemanager.resource.cpu-vcores
单个计算节分配出来的核数,如果计算几点64核,这里可以设置为60-62
搜索 yarn.scheduler.minimum-allocation-vcores 设置为 2
搜索 yarn.nodemanager.resource.memory-mb
单个计算节点分配出来的内存,如果计算节点是 64g,这是可以设置为 50g。(剩余主机内存保留,加上其他角色预留预留)
5.Impala 参数调整
搜索 Impala Daemon 的 Java 堆栈大小(字节) 设置为 8g(内存少,给4G也能跑)
搜索 Impala Daemon 内存限制 设置为 10g(越多越好)
一般默认 5个节点 x8g,内存充足适当上调
搜索 Impala Daemon Max Client Connections 200
注意
1.如果集群资源存在 多核少内存,核心和内存可配置 1:1 ,例如 mapreduce.reduce.memory.mb =2 mapreduce.map.memory.mb =2 和 yarn.scheduler.minimum-allocation-vcores = 2
2.如果集群资源存在 少核多内存,可适当调整内存参数 1:4 或者更高 ,例如 yarn.scheduler.minimum-allocation-vcores 1 、 mapreduce.reduce.memory.mb =4 和 mapreduce.map.memory.mb =4