HTTP 캐시로 불필요한 네트워크 요청 방지

일리야 그리고릭
일리야 그리고릭

네트워크를 통해 리소스를 가져오는 작업은 느리고 비용이 많이 듭니다.

  • 크기가 큰 응답은 브라우저와 서버 간에 많은 왕복이 필요합니다.
  • 중요한 리소스가 모두 완전히 다운로드될 때까지는 페이지가 로드되지 않습니다.
  • 사용자가 제한된 모바일 데이터 요금제로 사이트에 액세스하는 경우 불필요한 네트워크 요청은 비용 낭비입니다.

불필요한 네트워크 요청을 방지하려면 어떻게 해야 하나요? 브라우저의 HTTP 캐시는 첫 번째 방어선입니다. 반드시 가장 강력하거나 유연한 접근 방식은 아니며 캐시된 응답의 전체 기간을 제어할 수 있지만, 효과적이며 모든 브라우저에서 지원되며 많은 작업이 필요하지 않습니다.

이 가이드에서는 효과적인 HTTP 캐싱 구현의 기본사항을 설명합니다.

브라우저 호환성

실제로 HTTP 캐시라고 하는 단일 API는 없습니다. 웹 플랫폼 API 모음의 일반적인 이름입니다. 이러한 API는 모든 브라우저에서 지원됩니다.

HTTP 캐시의 작동 방식

브라우저가 수행하는 모든 HTTP 요청은 먼저 요청을 처리하는 데 사용할 수 있는 유효한 캐시된 응답이 있는지 여부를 확인하기 위해 브라우저 캐시로 라우팅됩니다. 일치하는 응답이 있으면 캐시에서 읽혀지므로 전송으로 인해 발생하는 네트워크 지연 시간과 데이터 비용이 모두 제거됩니다.

HTTP 캐시의 동작은 요청 헤더응답 헤더의 조합으로 제어됩니다. 이상적인 시나리오에서는 요청 헤더를 결정하는 웹 애플리케이션의 코드와 응답 헤더를 결정하는 웹 서버 구성을 모두 제어할 수 있습니다.

자세한 개념 개요는 MDN의 HTTP 캐싱 문서를 참조하세요.

요청 헤더: 일반적으로 기본값을 유지합니다.

웹 앱의 발신 요청에 포함해야 하는 중요한 헤더가 많이 있지만 브라우저는 거의 항상 요청을 실행할 때 사용자 대신 헤더 설정을 처리합니다. If-None-MatchIf-Modified-Since와 같이 최신 여부 확인에 영향을 미치는 요청 헤더는 브라우저가 HTTP 캐시의 현재 값을 이해한 내용에 따라 표시됩니다.

이는 좋은 소식입니다. 즉, HTML에 <img src="my-image.png">와 같은 태그를 계속 포함할 수 있으며 브라우저에서 추가 작업 없이 자동으로 HTTP 캐싱을 처리합니다.

응답 헤더: 웹 서버 구성

HTTP 캐싱 설정에서 가장 중요한 부분은 웹 서버가 각 발신 응답에 추가하는 헤더입니다. 다음 헤더는 모두 효과적인 캐싱 동작에 영향을 미칩니다.

  • Cache-Control. 서버는 Cache-Control 지시문을 반환하여 브라우저 및 기타 중간 캐시가 개별 응답을 캐시해야 하는 방법과 기간을 지정할 수 있습니다.
  • ETag. 브라우저가 만료된 캐시된 응답을 찾으면 서버에 작은 토큰(일반적으로 파일 콘텐츠의 해시)을 전송하여 파일이 변경되었는지 확인할 수 있습니다. 서버가 동일한 토큰을 반환하는 경우 파일은 동일한 것이므로 다시 다운로드할 필요가 없습니다.
  • Last-Modified. 이 헤더는 ETag와 같은 용도로 사용되지만 ETag의 콘텐츠 기반 전략과 달리 시간 기반 전략을 사용하여 리소스가 변경되었는지 확인합니다.

일부 웹 서버에는 이러한 헤더를 기본적으로 설정할 수 있는 지원 기능이 내장되어 있으며, 다른 웹 서버에는 명시적으로 구성하지 않는 한 헤더를 완전히 생략할 수 있습니다. 헤더를 구성하는 방법에 관한 구체적인 세부정보는 사용하는 웹 서버에 따라 크게 다르므로 가장 정확한 세부정보를 얻으려면 서버의 문서를 참조하세요.

검색 시간을 절약하기 위해 인기 웹 서버를 구성하는 방법은 다음과 같습니다.

Cache-Control 응답 헤더를 생략해도 HTTP 캐싱은 사용 중지되지 않습니다. 대신 브라우저는 특정 유형의 콘텐츠에 가장 적합한 캐싱 동작 유형을 효과적으로 추측합니다. 원하는 것보다 더 세밀한 제어가 필요할 수 있으므로 시간을 들여 응답 헤더를 구성하세요.

어떤 응답 헤더 값을 사용해야 하나요?

웹 서버의 응답 헤더를 구성할 때 다루어야 할 중요한 두 가지 시나리오가 있습니다.

버전이 지정된 URL의 장기 캐싱

버전이 지정된 URL이 캐싱 전략에 도움이 되는 방식
버전이 지정된 URL을 사용하면 캐시된 응답을 더 쉽게 무효화할 수 있으므로 좋은 방법입니다.

서버가 브라우저에 CSS 파일을 1년 (Cache-Control: max-age=31536000) 동안 캐시하도록 지시했지만 디자이너가 방금 개발자가 즉시 적용해야 하는 긴급 업데이트를 만들었다고 가정해 보겠습니다. 브라우저의 캐시된 파일 사본을 '오래된' '오래된' 사본을 업데이트하려면 어떻게 해야 하나요? 변경할 수 없습니다. 적어도 리소스의 URL을 변경하지 않는다면 말이죠. 브라우저에서 응답을 캐시한 후에는 캐시된 버전이 max-age 또는 expires에 의해 확인된 대로 더 이상 최신 상태가 아닐 때까지 또는 다른 이유(예: 사용자가 브라우저 캐시를 지우는 경우)로 캐시에서 삭제될 때까지 사용됩니다. 따라서 여러 사용자가 페이지가 생성될 때 서로 다른 버전의 파일을 사용하게 될 수 있습니다. 리소스를 방금 가져온 사용자는 새 버전을 사용하는 반면, 이전이지만 여전히 유효한 사본을 캐시한 사용자는 응답의 이전 버전을 사용합니다. 클라이언트 측 캐싱과 빠른 업데이트, 이 두 가지 모두를 가장 잘 활용하려면 어떻게 해야 할까요? 리소스의 URL을 변경하고 콘텐츠가 변경될 때마다 사용자가 새 응답을 다운로드하도록 합니다. 일반적으로 파일 이름에 파일의 디지털 지문이나 버전 번호를 삽입하여 이를 수행합니다(예: style.x234dff.css).

'지문' 또는 버전 정보가 포함되어 있고 콘텐츠가 변경되지 않는 URL에 대한 요청에 응답할 때는 Cache-Control: max-age=31536000를 응답에 추가합니다.

이 값을 설정하면 다음 1년 동안 (31,536,000초, 최대 지원 값) 동일한 URL을 로드해야 할 때 웹 서버에 네트워크 요청을 하지 않고도 HTTP 캐시의 값을 즉시 사용할 수 있음을 브라우저에 알립니다. 좋습니다. 네트워크를 피함으로써 안정성과 속도를 즉시 얻었습니다.

webpack과 같은 빌드 도구는 애셋 URL에 해시 디지털 지문을 할당하는 프로세스를 자동화할 수 있습니다.

버전이 지정되지 않은 URL의 서버 유효성 재검증

안타깝게도 로드하는 모든 URL에 버전이 지정되지는 않습니다. 웹 앱을 배포하기 전에 빌드 단계를 포함할 수 없어서 애셋 URL에 해시를 추가할 수 없을 수도 있습니다. 또한 모든 웹 애플리케이션에는 HTML 파일이 필요합니다. 이러한 파일에는 버전 관리 정보가 거의 포함되지 않을 것입니다. 방문할 URL이 https://example.com/index.34def12.html임을 기억해야 하는 경우 아무도 웹 앱을 사용하지 않기 때문입니다. 그렇다면 이러한 URL에는 무엇을 할 수 있을까요?

이는 귀하가 패배를 인정해야 하는 한 가지 시나리오입니다. HTTP 캐싱만으로는 네트워크를 완전히 회피할 수 없습니다. (걱정하지 마세요. 곧 서비스 워커에 대해 알게 될 것입니다. 서비스 워커는 개발자의 지지를 얻는 데 필요한 지원을 제공합니다.) 하지만 네트워크 요청이 가능한 한 빠르고 효율적으로 이루어지도록 하기 위해 취할 수 있는 몇 가지 조치가 있습니다.

다음 Cache-Control 값은 버전이 지정되지 않은 URL이 캐시되는 위치와 방법을 세부적으로 조정하는 데 도움이 됩니다.

  • no-cache: 캐시된 버전의 URL을 사용하기 전에 매번 서버에서 유효성을 다시 검사해야 한다고 브라우저에 지시합니다.
  • no-store. 이는 브라우저 및 기타 중간 캐시 (예: CDN)에 파일의 어떠한 버전도 저장하지 않도록 지시합니다.
  • private. 브라우저는 파일을 캐시할 수 있지만 중간 캐시는 캐시할 수 없습니다.
  • public. 응답은 모든 캐시에 저장될 수 있습니다.

사용할 Cache-Control 값을 결정하는 프로세스를 시각화하려면 부록: Cache-Control 플로우 차트를 참고하세요. Cache-Control는 쉼표로 구분된 명령어 목록을 허용합니다. 부록: Cache-Control 예시를 참고하세요.

이와 함께 추가 응답 헤더 두 개(ETag 또는 Last-Modified) 중 하나를 설정하면 도움이 될 수 있습니다. 응답 헤더에서 언급했듯이 ETagLast-Modified의 목적은 동일합니다. 즉, 만료된 캐시된 파일을 브라우저에서 다시 다운로드해야 하는지 판단하는 것입니다. ETag가 더 정확하므로 권장되는 방법입니다.

ETag 예

최초 가져오기 이후 120초가 지났으며 브라우저에서 동일한 리소스에 관한 새 요청을 시작했다고 가정해 보겠습니다. 먼저 브라우저가 HTTP 캐시를 확인하고 이전 응답을 찾습니다. 안타깝지만 응답이 현재 만료되었으므로 브라우저에서 이전 응답을 사용할 수 없습니다. 이 시점에서 브라우저는 새 요청을 전달하고 새 전체 응답을 가져올 수 있습니다. 하지만 리소스가 변경되지 않은 경우 이미 캐시에 있는 동일한 정보를 다운로드할 이유가 없으므로 이 방법은 비효율적입니다. ETag 헤더에 지정된 대로 유효성 검사 토큰으로 이 문제를 해결할 수 있습니다. 서버는 일반적으로 파일 콘텐츠의 해시 또는 다른 디지털 지문인 임의 토큰을 생성하고 반환합니다. 브라우저는 디지털 지문이 생성되는 방식을 알 필요가 없으며 다음 요청 시 지문을 서버로 전송하기만 하면 됩니다. 디지털 지문이 여전히 동일한 경우 리소스가 변경되지 않은 것이므로 브라우저에서 다운로드를 건너뛸 수 있습니다.

ETag 또는 Last-Modified를 설정하면 유효성 재검사를 훨씬 효율적으로 요청할 수 있습니다. 결국 요청 헤더에 언급된 If-Modified-Since 또는 If-None-Match 요청 헤더를 트리거합니다.

올바르게 구성된 웹 서버에서 이러한 수신 요청 헤더를 발견하면 브라우저의 HTTP 캐시에 이미 있는 리소스 버전이 웹 서버의 최신 버전과 일치하는지 확인할 수 있습니다. 일치하는 항목이 있으면 서버는 304 Not Modified HTTP 응답으로 응답할 수 있습니다. 이 응답은 'Hey, 계속 사용한 것을 계속 사용하세요'와 같습니다. 이러한 유형의 응답을 보낼 때는 전송할 데이터가 거의 없으므로 일반적으로 요청 중인 실제 리소스의 사본을 실제로 돌려보내는 것보다 훨씬 빠릅니다.

리소스를 요청하는 클라이언트와 304 헤더로 응답하는 서버의 다이어그램
브라우저가 서버에 /file를 요청하고 If-None-Match 헤더를 포함하여 서버에 있는 파일의 ETag가 브라우저의 If-None-Match 값과 일치하지 않는 경우에만 전체 파일을 반환하도록 지시합니다. 여기서는 두 값이 일치했으므로 서버는 파일을 캐시해야 하는 기간에 관한 안내와 함께 304 Not Modified 응답을 반환합니다 (Cache-Control: max-age=120).

요약

HTTP 캐시는 불필요한 네트워크 요청을 줄이기 때문에 로드 성능을 개선하는 효과적인 방법입니다. 모든 브라우저에서 지원되며 설정에 많은 작업이 필요하지 않습니다.

다음 Cache-Control 구성으로 시작하면 좋습니다.

  • Cache-Control: no-cache: 리소스를 사용할 때마다 서버에서 재검증해야 하는 리소스입니다.
  • Cache-Control: no-store: 캐시해서는 안 되는 리소스
  • 버전이 지정된 리소스의 경우 Cache-Control: max-age=31536000

ETag 또는 Last-Modified 헤더를 사용하면 만료된 캐시 리소스의 유효성을 더 효율적으로 재확인할 수 있습니다.

자세히 알아보기

Cache-Control 헤더 사용에 관한 기본사항을 자세히 알아보려면 제이크 아치볼드의 캐싱 권장사항 및 max-age gotchas 가이드를 확인하세요.

재방문자를 위해 캐시 사용을 최적화하는 방법에 대한 안내는 캐시 최적화를 참조하세요.

부록: 추가 도움말

시간이 더 있다면 다음과 같은 방법으로 HTTP 캐시 사용을 최적화할 수 있습니다.

  • 일관된 URL을 사용합니다. 여러 URL에서 동일한 콘텐츠를 제공하는 경우 해당 콘텐츠를 여러 번 가져와 저장합니다.
  • 앱 제거 최소화 리소스의 일부 (예: CSS 파일)는 자주 업데이트되는 반면 파일의 나머지 (예: 라이브러리 코드)는 자주 업데이트되지 않는 경우 자주 업데이트되는 코드를 별도의 파일로 분할하고 자주 업데이트되는 코드에는 짧은 기간의 캐싱 전략을 사용하고 자주 변경되지 않는 코드에는 긴 캐싱 기간 전략을 사용하는 것이 좋습니다.
  • Cache-Control 정책에서 일정 수준의 비활성이 허용되는 경우 새로운 stale-while-revalidate 지시어를 확인하세요.

부록: Cache-Control 플로우 차트

플로차트

부록: Cache-Control 예시

Cache-Control 설명
max-age=86400 응답은 최대 1일 (60초 x 60분 x 24시간) 동안 브라우저 및 중간 캐시에서 캐시될 수 있습니다.
private, max-age=600 응답은 최대 10분(60초 x 10분) 동안 브라우저에서 캐시될 수 있지만 중간 캐시는 캐시되지 않습니다.
public, max-age=31536000 응답은 모든 캐시에 1년 동안 저장될 수 있습니다.
no-store 응답은 캐시할 수 없으며 모든 요청마다 전체를 가져와야 합니다.