전체 글 714

컨테이너 이미지가 immutable 하지 않아서 겪은 이슈

사용하고 있는 SaaS 컨테이너 이미지가 immutable하지 않아 겪었던 이슈를 이야기해보려고 합니다. 컨테이너 이미지가 immutable이라는 의미는 컨테이너 이미지 내용이 변하지 않는 것을 보장합니다. 항상 같은 컨테이너 이미지 태그를 사용하면 어디서 실행하던지 내용은 같다는 뜻입니다. 하지만 최근 immutable하지 않은 이미지로 개발환경에서 이슈를 겪었고 동일 증상이 운영환경에서도 일어날 수 있는 것을 확인했습니다.  이슈의 시작은 개발환경에서 crashloopbackoff에서 시작합니다. 해당 pod는 init container와 애플리케이션 컨테이너가 있었고, init container오류로 pod가 crashloopbackoff였습니다. init container는 약 한달동안 이슈가 없..

회고모음 2025.01.14

EKS Pod 운영비용: 비용 절약과 안정성 사이의 현실적인 선택

AWS EKS 환경에서 운영 비용을 줄이려면 다양한 방법을 고려해야 합니다. 그중 하나는 모든 pod를 하나의 AZ(Availability Zone)에서 실행하는 것입니다. 동일한 AZ 내의 네트워크 트래픽은 추가 비용이 발생하지 않으므로, 이를 통해 비용을 절감할 수 있습니다. 비용 절약의 이점동일 AZ에서만 pod를 운영하면 네트워크 전송비용이 발생하지 않아 한 달 운영비용의 15%를 절약할 수 있습니다. 예를 들어, 한 달 운영비용이 1억 원이라면 1,500만 원을 아낄 수 있는 셈입니다. 안정성의 문제하지만 AZ를 하나만 사용하면 단일 장애점(Single Point of Failure)이 발생할 위험이 있습니다. AZ 장애가 발생하면 모든 서비스가 중단되어 서비스 안정성이 심각하게 저하될 수 있습..

쿠버네티스 노드 헬스체크 원리(lease API)

1.  개요이 글은 쿠버네티스가 어떻게 노드를 헬스체크하는지 설명합니다. 노드 헬스체크의 원리는 비정상 노드의 kubelet로그를 분석할 때 활용할 수 있습니다. 2.  이 글을 읽으면 알 수 있는 것노드 헬스체크에 사용하는 kubernetes lease APInode not ready를 탐지하는 시간 3.  헬스체크 알고리즘: lease쿠버네티스의 노드 헬스체크는 lease 알고리즘을 사용합니다. lease는 번역하면 임대라는 뜻입니다. lease라는 개념은 일정 시간 동안만 자원을 빌린다는 뜻입니다. 쿠버네티스는 노드를 lease 객체로 등록하여 노드자원을 lease 합니다.kubectl get leases -n kube-node-lease lease 알고리즘은 일정 시간동안 자원을 빌리는 개념이기..

회고 - 개발환경에서 테스트할 수 없어, 운영환경에 바로 적용했는데 장애

드물게 개발 또는 검수(QA)환경이 없는 시스템이 있습니다. 운영환경에 바로 작업을 해야 합니다. 기능을 수정하거나 추가할 때, 작업자는 작업이 성공적으로 끝나길 기도할 수 밖에 없습니다.최근에 저도 운영환경에 바로 적용해야 할 때가 있었는데, 작업이 잘 안 안되었고 서비스 장애가 났었습니다. 약 20분정도 걸려 장애를 복구 했습니다. 작업이 끝나고, 운영환경  밖에 없는 시스템에서 어떻게 기능을 적용할지 많은 고민이 들었습니다.

회고모음 2025.01.12

Mac OS에서 Docker Desktop 악성코드 오탐지 문제 해결

1. 개요2025년 1.1 새해가 되자, macOS의 Docker Desktop  이 악성코드로 오탐지 되었습니다.Malware Blockedcom.docker.vmnetd was not opened because it contains malware 1.2.  문제원인Docker desktop 자체가 악성코드가 아니지만, 인증서 만료로 인해 발생한 오탐지되었습니다. macOS desktop은 무결성과 신뢰성을 보장하기 위해 디지털 서명과 인증서 체인 검증을 수행합니다. Docker Desktop 2024년 버전에서는 com.docker.vmnetd 파일이 유효 기간이 만료된 인증서로 서명되어 있었습니다애플 개발자 페이지에 방문하면 인증서 발급 절차가 있습니다. 1.3.  인증서 검사codesign, op..