본문 바로가기
TIL

[TIL] 로드 밸런싱

by 쾌횽 2024. 4. 15.
반응형

🧐 로드 밸런싱이란 무엇인가?

로드 밸런싱은 애플리케이션을 지원하는 리소스 풀 전체에 네트워크 트래픽을 균등하게 배포하는 방식이다. 

많은 양의 트래픽을 처리하기 위해 대부분 애플리케이션에는 데이터가 중복되는 리소스 서버가 많이 있다. 

 

로드 밸런싱의 이점

로드 밸런싱은 애플리케션 서버와 방문자 또는 클라이언트 간의 인터넷 트래픽을 지시하고 제어한다. 결과적으로 애플리케이션의 가용성, 확장성, 보안 및 성능이 향상된다.

 

애플리케이션 가용성

서버 장애 또는 유지 관리로 인해 애플리케이션 가동 중지 시간이 늘어 방문자가 애플리케이션을 사용할 수 없게 될 수도 있다. 로드 밸런서는 서버 문제를 자동으로 감지하고 클라이언트 트래픽을 사용 가능한 서버로 리디렉션하여 시스템의 내결함성을 높인다. 로드 밸런싱을 사용하여 다음 태스크를 더 쉽게 수행 할 수 있다.

  • 애플리케이션 가동 중지 없이 애플리케이션 서버 유지 관리 또는 업그레이드 실행
  • 백업 사이트에 자동 재해 복구 제공
  • 상태 확인을 수행하고 가동 중지를 유발할 수 있는 문제 방지

애플리케이션 확장성

로드 밸런서를 사용하여 여러 서버 간에 네트워크 트래픽을 지능적으로 전달할 수 있다. 로드 밸런싱이 다음을 수행하므로 애플리케이션에서 수천 개의 클라이언트 요청을 처리할 수 있다.

  • 한 서버에서 트래픽 병복 현상 방지
    • 병목 현상 - 서버가 들어오는 요청을 효율적으로 처리할 수 없을때 발생하며, 이로 인해 로딩 시간이 느려지고 웹 사이트 성능이 저하된다.
  • 필요한 겅우 다른 서버를 추가하거나 제거할 수 있도록 애플리케이션 트래픽을 예측한다.
  • 안심하고 조정할 수 있도록 시스템에 중복성을 추가한다.

🧐 스케일 업(Scale-up)

스케일 업은 기존의 서버를 보다 높은 사양으로 업그레이드하는 것을 말한다.

하드웨어적 예시 - 성능이나 용량 증강을 목적으로 하나의 서버에 디스크를 추가하거나 CPU, 메모리 업그레이드시키는 것를 말한다.

하나의 서버의 능력을 증강 시키기 떄문에 수직 스케일일이라고도 한다.

 

🧐 스케일 아웃(Scale-out)

스케일 아웃은 장비를 추가해서 확장하는 것을 말한다.

기존 서버의 용량이나 성능의 한계에 도달했을때, 비슷한 사양의 서버를 추가로 연결해 처리 할 수 있는 데이터 용량이 증가할 뿐만 아니라 기존 서버의 부하를 분담해 성능 향상의 효과를 기대할 수 있다.

클라우드 서비스에서는 자원 사용량을 모니터링하여 자동으로 서버를 증설 하는 Auto Scaling기능도 있다.

서버를 추가적으로 확장하기에 수평 스케일링이라고도 한다.

🧐 로드 밸런싱 기법(알고리즘)

로드 밸런싱 기법은 여러가지가 있다. 서버의 능력을 고려하여 분배해야 하기 때문에 서버의 상황에 맞춰 적절한 방법을 선택해야한다.

 

라운드로빈 방식(Round Robin Method)

서버에 들어온 요청을 순서대로 돌아가며 배정하는 방식이다.

클라이언트의 요청을 순서대로 분배하기 때문에 여러 대의 서버가 동일한 스펙을 갖고 있고, 서버와의 연결이 오래 지속되지 않는 경우 활용하기 적합하다.

 

가중 라운드로빈 방식

각각의 서버마다 가중치를 매기고 가중치가 높은 서버에 클라이언트 요청을 우선적으로 배분한다. 주로 서버의 트래픽 처리 능력이 서로 다른 경우 사용되는 부하 분산 방식이다.

 

예를 들어 A라는 서버가 5라는 가중치를 갖고 B라는 서버가 2라는 가중치를 갖는다면, 로드밸런서는 라운드로빈 방식으로 A서버에 5개, B서버에 2개의 요청을 전달한다.

 

IP해시 방식 (IP Hash Method)

클라이언트의 IP주소를 특정 서버로 매핑하여 처리하는 방식이다.

 

최소 연결 방식(Least Connection Method)

요청이 들어온 시점에서 가장 적은 연결 상태를 보이는 서버에 우선적으로 트래픽을 배분한다. 자주 연결이 길어지거나, 서버에 분배된 트래픽들이 일정하지 않은 경우에 적합한 방식이다.

 

최소 응답 시간 방식(Least Response Time Method)

서버의 현재 연결 상태와 응답시간(서버에 요청을 보내고 최초 응답을 받을 때까지 소요되는 시간)을 모두 고려하여 트래픽을 배분한다.

가장 적은 연결 상태와 짧은 응답 시간을 보이는 서버에 우선적으로 업무를 배분한다.

 

🧐 L4로드 밸런싱과 L7로드 밸런싱

로드 밸런싱에는 L4로드 밸런싱과 L7로드 밸런싱이 가장 많이 활용된다.

 

L4로드 밸런서는 네트워크 계층(IP, IPX)이나 전송 계층(TCP,UDP)의 정보(IP주소, 포트번호, MAC주소, 전송 프로토콜)를 바탕으로 업무를 분산한다. 

 

L7로드 밸런서는 애플리케이션 계층(HTTP, FTP, SMTP)에서 로드를 분산하기 때문에 HTTP헤더, 쿠키 등과 같은 사용자의 요청을 기준으로 특정 서버에 트래픽을 분산하는 것이 가능하다. 쉽게 말해 패킷의 내용을 확인하고 그 내용에 따라 로드를 특정 서버에 분배하는 것이 가능한 것이다. URL에 따라 부하를 분산시키거나, HTTP헤더의 쿠키 값에 따라 부하를 분산하는 등 클라이언트의 요청을 보다 세분화해 서버에 전달 할 수 있다.

 

또한 L7로드 밸런서의 경우 특정한 패턴을 지는 바이러스를 감지해 네트워크를 보호할 수 있으며, DoS/ DDoS와 같은 비정상적인 트래픽을 필터링할 수 있어 네트워크 보안 분야에서도 활용되고 있다.

반응형

'TIL' 카테고리의 다른 글

[TIL] 면접카타 10일차  (0) 2024.04.29
[TIL] ALB, NLB, ELB의 차이점?  (0) 2024.04.16
[TIL] Redis에 대하여  (0) 2024.04.12
[TIL] 면접 카타 9일차  (0) 2024.04.09
[TIL] 면접카타 8일차  (0) 2024.04.08

댓글