Anthropic, Claude Sonnet 4.5·4의 1M 컨텍스트 베타 종료 커버 이미지
개발자

Anthropic, Claude Sonnet 4.5·4의 1M 컨텍스트 베타 종료

Anthropic이 Claude Sonnet 4.5와 Claude Sonnet 4에서 1M 토큰 컨텍스트 베타를 종료했다. 이제 해당 모델에서는 베타 헤더가 무효화되고, 200k 토큰을 넘는 요청은 오류가 반환된다. 대용량 문맥이 필요한 팀은 4.6 계열로 전환을 검토해야 한다.

코딩하는 상인 편집부·· 읽기 3개발자AI 스타트업마케터창업자프로덕트 매니저공식 출처 확인됨

Claude Sonnet 4.5와 Claude Sonnet 4를 쓰는 팀이라면 Anthropic의 1M 토큰 컨텍스트 윈도우 베타 종료를 먼저 점검해야 합니다. 공식 릴리스 노트에 따르면 context-1m-2025-08-07 베타는 종료됐고, 이제 해당 모델에서는 베타 헤더가 더 이상 효과가 없습니다.

3줄 요약

  • Claude Sonnet 4.5와 Claude Sonnet 4에서 1M 컨텍스트 베타가 종료됐습니다.
  • 표준 200k 토큰 컨텍스트를 넘는 요청은 이제 오류가 반환됩니다.
  • 1M 컨텍스트가 필요하면 Claude Sonnet 4.6 또는 Claude Opus 4.6으로 옮겨야 합니다.

무엇이 바뀌었나

핵심 변화는 단순합니다. 예전처럼 베타 헤더를 붙여 1M 토큰 컨텍스트를 활성화하는 방식이 Sonnet 4.5/4에서는 더 이상 작동하지 않는다는 점입니다. 모델명이 같더라도 동작 방식이 달라졌기 때문에, 기존 통합은 배포 후에야 문제를 드러낼 수 있습니다. Anthropic은 1M 컨텍스트를 쓰려면 Sonnet 4.6 또는 Opus 4.6으로 마이그레이션하라고 안내합니다. 다만 이 리서치팩 범위에서는 4.6의 정확한 출시 시점이나 세부 가격, 적용 범위의 추가 조건은 확인되지 않았습니다.

왜 중요한가

긴 문서 요약, 코드베이스 분석, 다중 파일 에이전트 워크플로처럼 긴 컨텍스트에 의존하는 제품은 요청 크기와 모델 경로를 다시 설계해야 합니다. 특히 200k 초과 입력이 오류로 바뀌면, 예전에는 “되던 요청”이 갑자기 실패할 수 있습니다. 이는 단순 기능 축소가 아니라 운영 안정성 문제입니다. 긴 문서를 무리하게 한 번에 넣는 설계는 비용 상승, 응답 지연, 실패율 증가로 이어질 수 있습니다.

한국 독자 영향

한국의 개발팀과 AI 스타트업은 Claude Sonnet 4.5/4 기반의 RAG, 코드리뷰, 문서 자동화 기능에서 1M 컨텍스트 전제를 제거해야 합니다. PoC나 엔터프라이즈 도입에서 긴 문서를 한 번에 처리하는 흐름을 유지하면 고객 환경에서 오류가 날 수 있습니다. 마케터와 기획자도 제품 소개서, 제안서, 내부 FAQ에서 “어떤 모델이 어느 컨텍스트를 지원하는지” 문구를 최신화할 필요가 있습니다. 특히 대용량 캠페인 자료나 리서치 문서를 내부 툴로 다루는 조직은 안내 문구가 실제 동작과 일치하는지 확인해야 합니다.

개발자/마케터/창업자 액션

  • 개발자: context-1m-2025-08-07 베타 헤더 사용 여부를 검색해 제거하고, 200k 초과 요청은 사전 토큰 카운트로 차단하세요.
  • 개발자: 오류 시 문서 분할, 청크 재구성, 요약 프리패스 같은 대체 경로를 반환하도록 핸들러를 업데이트하세요.
  • 마케터: 지원 모델과 컨텍스트 용량 설명을 release notes 기준으로 다시 쓰고, 엔터프라이즈 고객 안내문도 정리하세요.
  • 창업자: 대용량 컨텍스트 기능이 핵심이면 Sonnet 4.6/Opus 4.6 전환 비용과 마진 구조를 재산정하세요.
  • 창업자: SLA나 계약서에 특정 모델의 컨텍스트 한도와 변경 가능성을 반영하는지 점검하세요.

확인할 리스크

이번 변경이 모든 지역과 계정에 동시에 반영되는지, 순차 적용인지 이 자료만으로는 확인되지 않습니다. 또한 Sonnet 4.6과 Opus 4.6의 정확한 가격 정책, 출시 조건, SDK별 에러 메시지 차이는 별도 공식 문서 확인이 필요합니다. 무엇보다 기존 시스템이 1M 컨텍스트를 전제로 설계돼 있다면, 장애는 코드상 문제가 아니라 운영 중 런타임 오류로 드러날 수 있습니다.

결론

이번 조치는 Claude Sonnet 4.5·4를 쓰는 팀에게 “긴 문맥은 베타 헤더로 해결된다”는 전제를 끝냈다는 의미에 가깝습니다. 한국의 제품팀은 요청 분기, 토큰 제한, 오류 안내를 즉시 점검해야 하며, 1M 컨텍스트가 필요한 워크플로는 4.6 계열로의 전환 여부를 검토해야 합니다. 지금 필요한 것은 기능 확대가 아니라, 기존 통합이 더 이상 조용히 실패하지 않도록 만드는 점검입니다.

참고 출처

공식 1
공식 출처 확인됨공식 발표·문서·changelog 기반으로 작성했습니다.

함께 보면 좋은 글