반응형

helm 2

RKE2 모니터링과 로깅 완벽 가이드: Prometheus, Grafana, Loki 통합 구축

쿠버네티스 운영의 핵심은 클러스터 상태를 실시간으로 파악하고 이상 징후를 빠르게 대응하는 것입니다. RKE2 클러스터에서는 Prometheus를 이용해 메트릭을 수집·저장하고, Grafana로 시각화하며, Alertmanager로 알림을 처리하는 통합 모니터링 스택을 구축할 수 있습니다.모니터링 개요 및 아키텍처RKE2 모니터링 스택의 핵심 구성 요소:Prometheus메트릭 수집 및 저장시계열 데이터베이스, 알림 규칙 평가Grafana시각화 및 대시보드메트릭 시각화, 로그 탐색Alertmanager알림 처리알림 라우팅, 그룹화, 침묵 관리Node Exporter노드 메트릭 수집CPU, 메모리, 디스크, 네트워크kube-state-metrics쿠버네티스 리소스 메트릭Pod, Deployment, Serv..

RKE2 NAS 스토리지와 GPU 가속 연동 완벽 가이드: 온프레미스 AI/ML 인프라 구축

온프레미스 쿠버네티스 환경에서 NAS 스토리지와 GPU 가속을 RKE2에 연동하는 방법을 단계별로 알려드립니다. AI 학습부터 대용량 데이터 처리까지 모든 워크로드를 이용해 보세요.NAS 스토리지 연동: NFS 프로비저너 설치RKE2는 NFS를 통해 NAS 스토리지를 동적 프로비저닝할 수 있습니다.NFS 서버 설정# NFS 서버(Ubuntu)에서 실행sudo apt updatesudo apt install -y nfs-kernel-server# NFS 공유 디렉토리 생성sudo mkdir -p /nfs_sharesudo chown nobody:nogroup /nfs_sharesudo chmod 755 /nfs_share# NFS 내보내기 설정sudo tee -a /etc/exports /data/gpu..

반응형