HTTP 개관
1. HTTP 개관
1.1 HTTP: 인터넷의 멀티미디어 배달부
HTTP 통신이 전송 중 파괴되거나, 중복되거나, 왜곡되는 것을 걱정 X
1.2 웹 클라이언트 서버
웹 서버는 HTTP 프로토콜로 의사소통하기 때문에 보통 HTTP 서버라고 불린다.
클라이언트는 서버에게 HTTP 요청을 보내고, 서버는 요청된 데이터를 HTTP 응답으로 돌려줌
흔한 클라이언트: 크롬, ie …
1.3 리소스
웹 서버는 웹 리소스를 관리하고 제공
가장 단순한 웹 리소스는 웹 서버 파일 시스템의 정적 파일
동적 콘텐츠도 있음
1.3.1 미디어 타입
인터넷은 수천 가지 데이터 타입을 다루기 때문에, HTTP는 웹에서 전송되는 객체 각각에 신중하게 MIME 타입이라는 데이터 포맷 라벨을 붙임
MIME(Multipurpose Internel Mail Extensions, 다목적 인터넷 메일 확장)은 원래 각기 다른 전자메일 시스템 사이에서 메시지가 오갈 때 겪는 문제점을 해결하기 위해 만들어졌다.
웹 서버는 모든 HTTP 객체 데이터에 MIME 타입을 붙임
MIME 타입은 사선(/)으로 구분된 주 타입과 부 타입으로 이루어진 문자열 라벨
ex. text/html, text/plain, image/gif …
1.3.2 URI
통합 자원 식별자(uniform resource identifier)
URI는 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.
URI는 URL과 URN으로 구성
1.3.3 URL
통합 자원 지시자(uniform resource locator)
URL은 리소스가 어디에 있고 어떻게 접근할 수 있는지 분명히 알려줌
URL은 세 부분으로 이루어진 표준 포맷을 따름
- 스킴(scheme): 리소스에 접근하기 위해 사용하는 프로토콜(ex. http)
- 서버의 인터넷 주소
- 웹 서버의 리소스
1.3.4 URN
유니폼 리소스 이름(uniform resource name)
URN은 콘텐츠를 이루는 한 리소스에 대해, 그 리소스의 위치에 영향 받지 않는 유일무이한 이름 역할
리소스가 그 이름을 변하지 않게 유지하는 한, 여러 종류의 네트워크 접속 프로토콜로 접근해도 문제 없음
URN은 여전히 실험 중인 상태고 아직 널리 채택되지 않음
1.4 트랜잭션
1.4.1 메서드
HTTP는 HTTP 메서드라고 불리는 여러 가지 종류의 요청 명령을 지원
모든 HTTP 요청 메시지는 한 개의 메서드를 갖는다.
ex. GET, PUT, POST, DELETE, HEAD …
1.4.2 상태 코드
모든 HTTP 응답 메시지는 상태 코드와 함계 반환
ex. 200, 302, 404 …
HTTP는 각 숫자 생태 코드에 텍스트로 된 “사유 구절”도 함께 보낸다.
1.4.3 웹페이지는 여러 객체로 이루어질 수 있다.
애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다.
웹페이즈는 첨부된 리소스들에 대해 각각 별개의 HTTP 트랜잭션을 필요로 한다.
1.5 메시지
HTTP 메시지는 단순한 줄 단위의 문자열
웹 클라이언트에서 웹 서버로 보낸 HTTP 메시지를 요청 메시지
서버에서 클라이언트로 가는 메시지는 응답 메시지
HTTP 메시지는 다음의 세 부분으로 이루어진다
시작줄
요청이라면 무엇을 해야하는지 응답이라면 무슨 일이 일어났는지
헤더
각 헤더 필드는 쉬운 구문분석을 위해 쌍점(:)으로 구분되어 있는 하나의 이름과 하나의 값으로 구성
본문
어떤 종류의 데이터든 들어갈 수 있는 메시지 본문이 필요에 따라 올 수 있다.
본문은 임의의 이진데이터 포함 가능
1.6 TCP 커넥션
1.6.1 TCP/IP
HTTP는 애플리케이션 전송 프로토콜
HTTP는 네트워크 통신의 핵심적인 세부사항에 대해서 신경 쓰지 않는다.
TCP
- 오류 없는 데이터 전송
- 순서에 맞게 전달
- 조각나지 않는 데이터 스트림
TCP/IP는 TCP와 IP가 층을 이루는, 패킷 교환 네트워크 프로토콜 집합
1.6.2 접속, IP 주소 그리고 포트번호
HTTP 클라이언트가 서버에 메시지를 전송할 수 있게 되기 전에, 인터넷 프로토콜 주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야 한다.
TCP에서는 서버 컴퓨터에 대한 IP 주소와 그 서버에서 실행 중인 프로그램이 사용 중인 포트번호가 필요하다.
IP 또는 DNS를 이용하여 주소와 포트번호 확인
포트번호가 없는 경우 기본 값 80
웹브라우저가 HTTP를 이용해서 서버의 리소스슬 사용자에게 보여주는 순서
- 웹브라우저는 서버의 URL에서 호스트 명 추출
- 호스트명을 IP로 변환
- 포트번호 추출
- 웹서버와 TCP 커넥션
- 서버에 HTTP 요청 보냄
- 응답 받음
- 문서 보여줌
1.7 프로토콜 버전
- HTTP/0.9
- HTTP/1.0
- HTTP/1.0+
- HTTP/1.1
- HTTP/2.0
1.8 웹의 구성요소
1.8.1 프락시
프락시는 클라이언트와 서버 사이에 위치하여, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다.
프락시는 주로 보안을 위해 사용
모든 웹 트래픽 흐름 속에서 신뢰할만한 중개자 역할을 한다.
요청과 응답을 필터링
1.8.2 캐시
자신을 거쳐 가는 문서들 중 자주 찾는 것의 사본을 저장해 두는, 특별한 종류의 HTTP 프락시 서버
클라이언트는 멀리 떨어진 웹 서버보다 근처의 캐시에서 훨씬 더 빨리 문서를 다운받을 수 있다.
1.8.3 게이트웨이
게이트웨이는 다른 서버들의 중개자로 동작하는 특별한 서버
게이트웨이는 주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용
1.8.4 터널
터널은 두 커넥션 사이에서 raw 데이터를 열어보지 않고 그대로 전달해주는 HTTP 애플리케이션
HTTP 터널은 주로 비 HTTP 데이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용
ex. 사내 방화벽
1.8.5 에이전트
에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램
ex. 브라우저, 자동화 에이전트(스파이더, 웹로봇)
참조
- HTTP 완벽 가이드