为了更快的定位您的问题,请提供以下信息,谢谢
【详述】3个BE节点异常退出后,无法启动
【背景】
开发进行update全表一个字段值,导致三个BE均崩溃(进程退出)。对BE进行启动时,无法启动。
BE配置限制使用30G内存
mem_limit = 30G
以下时崩溃时,BE INFO的日志(详细查看附件)
image2536×1358 569 KB
以下是BE WARNING的日志(详细查看附件)
image2529×1376 576 KB
FE进程正常 BE启动几秒后提示killed(被内核OOM killed)
b57b29b168523b0395dc7decedf6133695×120 2.71 KB
启动BE时 out日志。
f4bcfb5d356b0c9dffbe8d7c39a50b91537×252 16.8 KB
启动BE前系统内存占用情况。
8bc734f6436b4e3bba113196ea31c81783×126 4.21 KB
linux内核有be的oom信息(be限制10G 和20G 都会有oom)
ed65da52b1e2689bad6d35b65b0f69c1611×464 39.3 KB
eced8480137e3255bb0c710227248922250×998 1.46 MB
BE配置
2357af422a8045cdbd83ce616b3dad8911×958 106 KB
FE配置
c1a2af6554819918b4ed998045516bf2042×1021 201 KB
【业务影响】影响所有涉及使用StarRocks系统(所有业务)。
【是否存算分离】否
【StarRocks版本】3.2.6
【集群规模】3fe(1 LEADER+2FOLLOWER)+3be(fe与be混部)
【机器信息】12C/38G/万兆
【联系方式】社区群17- Kay,谢谢
【附件】
fe.log/beINFO/相应截图 上面已提供
附件过大请在群内联系
慢查询:
Profile信息
并行度:show variables like ‘%parallel_fragment_exec_instance_num%’;
pipeline是否开启:show variables like ‘%pipeline%’;
be节点cpu和内存使用率截图
查询报错:
query_dump,怎么获取query_dump文件
be crash
be.out
coredump,如何获取coredump
外表查询报错
be.out和fe.warn.log