개발자로서 살아남기/ELK Stack 적용하기

ELK - primary shard is not active Timeout 에러

코드 살인마 2023. 6. 22. 16:16
728x90

네트워크 팀에서 VM 머신 초기화로 인해 elastic이 꺼졌었다.

 

다시 재부팅 하는 과정에서 위와 같은 로그가 남았는데, 구글링 해보니 elasticsearch 구성파일 중cluster.initial_master_nodes 설정 문제였다.

 

해당 설정은 맨 처음 클러스터를 시작할 때만 적용하고 이후에, 지워야 하는 옵션임을 공식문서에서 확인하였다.

 

 

그 이후에 cluster의 상태를 보니 red 상태였다.

 

로그를 보니, 몇몇 샤드들이 활성화가 되지 않아있었다.

 

그말은 해당 샤드를 가지고 있는 노드가 클러스터에 안붙었다는 얘기인데, 계속 원인을 찾다가 masterNode 역할을 하는 머신 1대가 무슨 이유인지 설정이 초기화 되어있었다. (elasticsearch.yml, jvm.options)

 

모든 노드(마스터, 데이터)을 확인하여 연결하니 green 상태로 돌아왔다.

 

즉 primary shard is not active Timeout 에러를 만난다면, 모든 노드가 정상적으로 작동안하고 있다는 뜻이니, 노드 설정, on/off 여부를 확인해야한다.