본문 바로가기
HTTP

모든 개발자를 위한 HTTP 웹 기본 지식_섹션3_HTTP_기본

by 킴도TV 2022. 1. 22.

모든 것이 HTTP(HyperText Transfer Protocol)

HyperText Transfer Protocol
초기의 정의: 주로 문서간의 링크를 통해서 연결할 수 있는 프로토콜, 문서는 Html.

  • 현재는 모든 것이 HTTP의 메시지를 통해 전송합니다.
    • HTML, TEXT
    • IMAGE, 음성, 영상, 파일
    • JSON, XML
    • 서버간에 데이터를 주고 받을 때도 대부분 HTTP 사용
      등등 모든 것이 HTTP를 통해 전송이 됩니다. 지금은 HTTP 시대!
  • HTTP 역사

HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
=> 가장 중요한 버전이므로 1.1을 공부를 많이 해야 한다.

  • 기반 프로토콜
    • TCP: HTTP/1.1, HTTP/2
    • UDP: HTTP/3 (👍)
    • 현재 HTTP/1.1 주로 사용
    • HTTP/2, HTTP/3 도 점점 증가
  • f12 눌러서 http 버전 확인하기
  • 구글은 http/3 사용
  • 네이버는 http/2 사용

그래도 중요한 건 우리가 http/1.1 스펙을 심도있게 공부하고 잘 알아야 하는 것이다.

클라이언트 서버 구조

  • 클라이언트가 request 를 보내고, 서버를 받아서 response 를 보내는 형식
  • 서버는 클라이언트로부터 요청을 받을 때까지 무작정 기다린다.
  • 서버가 요청에 대한 결과를 만들어서 응답클라이언트는 (물론 비즈니스를 처리하는 로직이 있지만) 더 좋은 UI, 더 좋은 사용성에 집중하면 되고,
    서버는 많은 트래픽을 어떻게 처리할지, 데이터를 어떻게 관리할지 등등 서버 튜닝등에 신경을 쓰면 된다.
    ps. 따라서 각각 각 분야의 전문가가 될 것이고 해당 일을 그들에게 맡기면 된다.
  • 독립적으로 진화한다는게 중요하다!
  • 예전에는 서버와 클라이언트로 분리되어있지 않고 한 뭉텅이로 있었다.
    그런데 서버와 클라이언트로 분리했고, 중요한게 비즈니스 로직과 데이터를 서버에 다 집어넣는다.
    그리고 클라이언트는 뭐에 집중하냐면, 바로 UI를 그리고, 사용성에 집중을 한다.
    이게 왜 중요하냐면 이제부터 클라이언트와 서버가 각각 독립적으로 진화할 수 있게 된다는 큰 장점이 생긴다.

무상태 프로토콜

스테이트리스(stateless)

  • 서버가 클라이언트의 상태를 보존 x
  • 장점: 서버 확장성 높음(scale out)
  • 단점: 클라이언트가 추가 데이터 전송

Stateful, Stateless 이란?

  • Stateful: 서버가 클라이언트의 이전 상태를 유지하는 것.
    • 강의 예시 (서버의 클라이언트 이전 상태값 유지)
      • [점원 A] 노트북 상태 유지
      • [점원 A] 노트북, 2개 상태 유지
      • [점원 A] 노트북, 2개, 신용카드 상태 유지
      • 갑자기 점원이 중간에 바뀌면? Context를 모르게 된다.
  • Stateless: 서버가 클라이언트의 이전 상태를 유지하지 않는 것.
  • 점원이 중간에 바뀌어버리는 상태, 따라서 클라이언트는 요청할때 모든 상태값을 들고 요청해야 한다.
    • 강의 예시 (클라이언트가 서버로 요청할 때)
      • [점원 A에게] (노트북) 얼마인가요?
      • [점원 B에게] (노트북, 2개) 구매하겠습니다.
      • [점원 C에게] (노트북, 2개, 신용카드)로 구매하겠습니다.

Stateful vs Stateless

  • 상태 유지(Stateful): 중간에 다른 점원으로 바뀌면 안된다.
    • (중간에 다른 점원으로 바뀔 때 상태 정보를 다른 점원에게 미리 알려줘야 한다)
  • 무상태(Stateless): 중간에 다른 점원으로 바뀌어도 된다. (-> 엄청 큰 장점!)
    • 갑자기 고객이 증가해도 점원이 대거 투입할 수 있다.
    • 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.
  • 무상태는 응답서버를 쉽게 바꿀 수 있다(즉 다른 점원으로). -> 무한한 서버 증설 가능
  • Stateful은 서버가 중간에 장애나면 클라이언트가 처음부터 다시 요청을 진행해야 하는 단점이 있다.
  • Stateless는 서버가 중간에 장애가 나도 다른 서버로 request 를 계속 진행하면 되니 다시 처음부터 요청할 필요가 없다.
    • Stateless 는 따라서 수평 확장(Scale Out)에 유리하다. 즉 서버 증설에 유리하다! -> 많은 사용자에게 서비스를 제공하려면 무조건 Stateless 네

But Stateless의 한계

단점 1

  • 무상태가 아닌 상태를 유지해야 하는 상황 (ex. 로그인) 이 있다.
    • 즉 사용자가 로그인 했다는 상태를 서버에서 계속 유지해야 하는데 따라서 Stateless 로 통하지 않는다. Stateful 해야 한다.
  • 로그인한 사용자의 경우 로그인을 했다는 상태를 서버에 유지
  • 일반적으로 브라우저 쿠키와 서버 세션등을 사용해서 상태 유지
  • 상태 유지는 최소한만 사용

단점 2

  • 요청할 때 데이터를 너무 많이 보내야 한다.

비 연결성(connectionless)

연결을 유지하는 모델

TCP/IP가 보통 연결을 유지한다.
=> 따라서 서버는 여러 클라이언트에 연결을 계속 유지, 서버 자원 소모.

연결을 유지하지 않는 모델

=> 좋은점: 서버는 연결 유지X, 연결을 끊어버린다. 따라서 최소한의 자원으로 서버를 유지할 수 있다.

  • 비 연결성
    • HTTP는 기본이 연결을 유지하지 않는 모델
    • 일반적으로 초 단위 이하의 빠른 속도로 응답
    • 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 적음
      • ex) 사용자가 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
    • 서버 자원을 매우 효율적으로 사용할 수 있음

비 연결성의 단점

  • TCP/IP 연결을 새로 맺어야 함 - 3 way handshake 시간 추가
  • 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지등 수많은 자원이 함께 다운로드 된다. -> f12로 까면 많은 리소스가 다운로드 되는 것을 알 수 있다.

=> 지금은 HTTP 지속 연결(Persistent Connections)로 문제해결을 하였다. HTTP 지속 연결이란?
=> HTTP/2, HTTP/3에서 더 많은 최적화.

  • HTTP 초기 - 연결, 종료 낭비
  • 이후에 HTTP 지속 연결 유지로 낭비 줄임.

스테이트리스를 기억하자

서버 개발자들이 어려워하는 업무

  • 정말 같은 시간에 딱 맞추어 발생하는 대용량 트래픽
  • ex) 선착순 이벤트, 명절 KTX 예약, 학과 수업 등록
  • ex) 저녁 6:00 선착순 1000명 치킨 할일 이벤트 -> 수만명 동시 요청

어떻게든 머리를 쥐어짜서 stateless 하게 설계해야 한다. 그러면 이러한 대용량 트래픽이 올때도 서버를 확 늘려서 대응할 수 있는 부분들이 많아진다.

꿀팁:
이벤트 설계할때 보통 이렇게 많이 한다.
로그인도 필요없는 정적 이벤트 페이지 뿌림(stateless) -> 사람들이 정적 이벤트 페이지에서 놀게 하고 보게한 다음에 이벤트 참여 버튼 누르게 함

항상 서버를 stateless 한 방식으로 설계해야 한다는 점을 잘 기억해야 한다.

HTTP 메시지

HTTP 메시지 구조

  • start-line 시작 라인 [필수]
  • header 헤더 [필수]
  • empty line 공백 라인 (CRLF-> 엔터로 보면 된다) [필수]
  • message body [선택] -> 없어도 됨

시작 라인

요청 메시지 - 전체

  • start-line = request-line / status-line
  • request-line = method SP(공백) request-target[리퀘스트 타겟에 path 가 들어간다] SP HTTP-version CRLF(엔터)

요청 메시지 - HTTP 메소드 (이게 정말 중요합니다)

  • 종류: GET, POST, PUT, DELETE...
  • 역할: 서버가 수행해야 할 동작 지정
    • GET: 리소스 조회
    • POST: 요청 내역 처리

요청 메시지 - request-target(요청 대상)

  • absolute-path[?query] (절대경로[?쿼리])
  • 절대경로= "/" 로 시작하는 경로
  • 참고: *, http://...?x=y 와 같이 다른 유형의 경로지정 방법도 있다.

응답 메시지 - 전체

  • start-line = request-line / status-line

  • status-line = HTTP-version SP status-code SP reason-phrase CRLF

  • HTTP 버전

  • HTTP 상태 코드(엄청 중요하다~!): 요청 성공, 실패를 나타냄

    • 200: 성공
    • 400: 클라이언트 요청 오류
    • 500: 서버 내부 오류
  • 이유 문구: 사람이 이해할 수 있는 짧은 상태 코드 설명 글

    • 200 인 경우 "OK"

헤더 라인

  • header-field = field-name ":" OWS field-value OWS (OWS:띄어쓰기 허용)
  • field-name은 대소문자 구문 없음

용도

  • HTTP 전송에 필요한 모든 부가정보(메타데이터)
  • 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보...
  • 표준 헤더가 너무 많음

HTTP 메시지 바디

  • 실제 전송할 데이터
  • HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능

단순함 확장 가능

  • HTTP는 단순하다. 스펙도 읽어볼만...
  • HTTP 메시지도 매우 단순(곤충 머리-가슴-배 처럼 단순하다 ㅋ)
  • 크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술

NOTE: 복잡한 것보다는 단순하지만 확장 가능한 기술이 크게 성공한다!!

=> Question. 여기에서 param이라고 하면 api 설명에 적혀있으면 query param을 뜻하는가요?