오픈AI 'GPT-5.6 Sol' 프리뷰 공개 — Sol·Terra·Luna 3종과 '정부 검토 출시'의 진짜 의미

오픈AI가 차세대 모델 GPT-5.6을 Sol·Terra·Luna 3종으로 공개했으며, 코딩·사이버보안 성능이 크게 향상됐지만 미국 정부 요청으로 일반 공개 대신 협력사 대상 제한적 프리뷰로 먼저 출시한다는 소식입니다.

코딩하는 상인·2026.06.29· 읽기 9분공식 출처 확인됨

오픈AI가 2026년 6월 26일, 차세대 모델 'GPT-5.6' 시리즈의 제한적 프리뷰를 시작한다고 공식 발표했습니다. 이번 세대는 세 가지 모델로 나뉩니다. 최상위 모델 솔(Sol), 일상 업무용 균형 모델 테라(Terra), 그리고 빠르고 저렴한 **루나(Luna)**입니다. 오픈AI는 솔을 "지금까지 가장 강력한 모델"이라고 소개하면서, 동시에 **"역대 가장 견고한 안전장치"**를 함께 적용했다고 강조했습니다.

이번 발표가 특별한 이유는 두 가지입니다. 하나는 모델 자체가 코딩·생물학·사이버보안에서 큰 폭으로 향상됐다는 점이고, 다른 하나는 이 모델이 일반 공개가 아니라 미국 정부와 조율한 '제한적 프리뷰'로 먼저 나온다는 점입니다. 앞서 보도로 먼저 알려졌던 'GPT-5.6 순차 출시'의 공식 버전인 셈인데, 오픈AI가 직접 그 배경과 속내를 밝혔다는 데 의미가 있습니다. 하나씩 짚어보겠습니다.

GPT-5.6은 무엇이 달라졌나 — 세 모델과 새로운 작동 방식

먼저 모델 구성부터 보겠습니다. 오픈AI는 이번에 새로운 이름 체계를 도입했습니다. 숫자(5.6)는 세대를 뜻하고, 솔·테라·루나는 각각 지속적으로 발전하는 '능력 등급'을 의미합니다. 쉽게 말해 같은 세대 안에서 성능·속도·비용에 따라 세 갈래로 나눈 것입니다.

솔(Sol): 최상위 플래그십 모델. 가장 어려운 작업을 위한 모델입니다.
테라(Terra): 이전 세대인 GPT-5.5와 비슷한 성능을 내면서 비용은 **절반(2배 저렴)**인 균형형 모델입니다.
루나(Luna): 가장 저렴한 비용으로 강력한 성능을 제공하는 경량 모델입니다.

작동 방식에서도 새로운 기능이 추가됐습니다. 깊이 있는 추론을 위해 더 오래 생각하게 하는 '맥스(max)' 추론 모드, 그리고 단일 에이전트의 한계를 넘어 하위 에이전트(subagent)들을 활용해 복잡한 작업을 가속하는 '울트라(ultra)' 모드입니다. 후자는 앞서 사카나 AI의 후구(Fugu)에서 봤던 '여러 에이전트를 조율하는' 흐름과도 맞닿아 있어, 업계 전반이 단일 모델에서 멀티에이전트 협업으로 무게중심을 옮기고 있음을 보여줍니다.

성능 면에서 오픈AI가 내세운 수치는 다음과 같습니다. 코딩에서는 명령줄 작업을 평가하는 **터미널벤치 2.1(Terminal-Bench 2.1)**에서 최고 기록을 세웠고, 생물학에서는 유전체 분석을 다루는 **진벤치(GeneBench)**에서 GPT-5.5보다 적은 토큰으로 더 나은 결과를 냈다고 밝혔습니다. 특히 주목할 부분은 사이버보안입니다. 취약점 연구·공격을 평가하는 **익스플로잇벤치(ExploitBench)**에서 솔은 앤트로픽의 미토스 프리뷰(Mythos Preview)와 비등한 성능을 — 그것도 약 3분의 1의 토큰만으로 — 보였다고 합니다. 다만 이 수치들은 모두 오픈AI가 자체 평가한 값이며, 더 광범위한 평가 결과는 정식 출시 때 공개하겠다고 밝혔습니다.

핵심 쟁점 — 왜 '제한적 프리뷰'로 먼저 나오나

이번 발표에서 가장 중요한 대목은 성능이 아니라 출시 방식입니다. 오픈AI는 솔·테라·루나를 몇 주 안에 일반 공개할 계획이라면서도, 그에 앞서 미국 정부의 요청에 따라 소수의 '신뢰할 수 있는 협력사'에게만 먼저 제공하는 제한적 프리뷰로 시작한다고 밝혔습니다. 프리뷰 기간 동안 협력사 참여 명단은 정부와 공유됩니다.

흥미로운 점은 오픈AI가 이 방식에 대해 분명한 불편함을 드러냈다는 것입니다. 발표문에서 회사는 "이런 정부 접근 절차가 장기적인 기본값이 되어서는 안 된다"며, 그것이 사용자·개발자·기업·사이버 방어자·글로벌 협력사 등 정작 도구가 필요한 사람들의 손에서 최고의 도구를 멀어지게 한다고 지적했습니다. 그럼에도 이번 단기 조치를 받아들이는 이유는, 그것이 몇 주 안에 더 넓은 공개로 가는 가장 강력한 경로라고 판단했기 때문이라고 설명했습니다.

이 맥락을 이해하려면 앞선 사건들을 알아야 합니다. 트럼프 대통령은 6월 2일 AI 행정명령에 서명하며, 강력한 모델을 공개 전 정부가 최대 30일간 검토하는 '자발적 사전 검토' 체계를 도입했습니다. NPR 보도에 따르면 당초 90일이던 검토 기간은 기업 경쟁력 우려로 30일로 줄었습니다. 그런데 6월 12일, 정부는 앤트로픽의 페이블 5·미토스 5에 대한 외국인 접근을 수출 통제로 전면 차단했고, 회사는 두 모델을 전 세계에서 내려야 했습니다. 이 일로 '자발적'이라던 검토가 사실상 **정부가 최첨단 AI 출시를 좌우하는 '비공식 허가제'**로 작동하는 것 아니냐는 우려가 업계에 번졌습니다.

GPT-5.6의 제한적 프리뷰는 바로 이 흐름의 연장선에 있습니다. 오픈AI가 행정명령의 '사이버 프레임워크'를 정부와 함께 다듬으면서, 동시에 향후 모델 출시에 반복 적용할 수 있는 절차를 만드는 과정의 일부라는 것이 회사의 설명입니다.

안전장치 — 강해진 능력에 맞춘 다층 방어

오픈AI가 이번에 유독 안전장치를 강조한 데는 이유가 있습니다. 솔은 사이버보안 능력이 크게 향상됐는데, 이는 방어에도 공격에도 쓰일 수 있는 양날의 검이기 때문입니다. 회사는 솔이 "엔드투엔드 공격을 수행하는 것보다 취약점을 찾고 고치는 데 더 능하다"고 밝히며, 이 능력이 방어자에게 먼저 닿도록 하는 것이 우선순위라고 강조했습니다.

오픈AI는 솔이 자사 대비 프레임워크(Preparedness Framework)상 '사이버 크리티컬' 임계치는 넘지 않았다고 설명했습니다. 크롬·파이어폭스 평가에서 버그와 공격의 구성요소는 찾아냈지만, 시험 조건에서 완전한 공격 체인을 자율적으로 만들어내지는 못했다는 것입니다. 그럼에도 능력의 큰 도약을 감안해 더 강한 안전장치와 단계적 출시를 함께 적용했다고 밝혔습니다.

안전장치의 핵심은 **'다층 방어'**입니다. 어떤 단일 장치도 끈질긴 오용을 완벽히 막을 수 없다는 전제 아래, 여러 겹의 보호를 쌓았습니다. 모델 자체에 학습된 거부 능력, 생성 도중 실시간으로 출력을 검사하는 분류기, 계정 단위의 패턴 분석, 차등 접근 권한 등이 그것입니다. 예를 들어 사이버·생물학 오용이 의심되면 생성을 멈추고 더 큰 추론 모델이 대화 맥락을 검토한 뒤, 위반으로 판단되면 사용자에게 도달하기 전에 출력을 차단합니다.

특히 인상적인 부분은 **자동화된 레드팀(red-teaming)**입니다. 오픈AI는 여러 프롬프트와 맥락에 두루 통하는 '범용 탈옥(universal jailbreak)'을 찾아내기 위해 70만 A100 GPU 시간 이상을 투입했다고 밝혔습니다. 자사 모델을 동원해 스스로의 약점을 찾고 더 빠르게 보완하는 방식인데, 사람만으로는 다 시험할 수 없는 방대한 공격 패턴을 탐색할 수 있다는 게 장점입니다. 다만 회사는 프리뷰 기간 중 정당한 작업까지 차단되거나 검토로 지연될 수 있다는 점을 인정하며, 바로 그런 사례를 줄이는 것이 이 프리뷰의 목적 중 하나라고 덧붙였습니다.

가격과 이용 방법

프리뷰 기간 동안 GPT-5.6 모델은 API와 코덱스(Codex)를 통해 소수의 협력사·조직에 우선 제공되며, 이후 챗GPT·코덱스·API 사용자에게 점차 확대됩니다. 100만 토큰당 가격은 다음과 같습니다.

솔(Sol): 입력 5달러 / 출력 30달러
테라(Terra): 입력 2.5달러 / 출력 15달러
루나(Luna): 입력 1달러 / 출력 6달러

또 오픈AI는 7월에 세레브라스(Cerebras) 칩 위에서 솔을 초당 최대 750토큰 속도로 제공할 계획이라고 밝혔습니다. 초기에는 일부 고객으로 제한됩니다.

한국 독자에게 어떤 의미가 있을까

이번 발표는 한국의 개발자와 기업에게 몇 가지 실질적 시사점을 줍니다.

먼저 비용 구조의 변화입니다. 테라가 GPT-5.5급 성능을 절반 가격에 제공한다는 점은, 국내에서 AI를 서비스에 얹어 쓰는 기업의 운영비에 직접 영향을 줍니다. 같은 성능을 더 싸게 쓸 수 있다면 그동안 비용 때문에 망설였던 기능을 도입할 여지가 생깁니다. 다만 가격은 달러 기준이고 환율·실제 토큰 사용량에 따라 체감 비용은 달라지므로, 도입 전 자사 워크로드 기준으로 따져보는 것이 좋습니다.

다음으로 접근 시점의 지연 위험입니다. 기업 자문사 펜윅의 분석이 지적했듯, 프런티어 모델을 직접 만들지 않고 그 위에서 서비스를 구축하는 대다수 기업에게 이 '정부 검토 + 협력사 우선' 구조는 새로운 의존 위험입니다. '신뢰할 수 있는 협력사' 명단에 들지 못하면, 국내 기업은 최신 모델을 남보다 늦게 쓰게 될 수 있습니다. 그 명단 기준이 아직 불투명하다는 점도 변수입니다.

마지막으로 사이버보안 도구로서의 양면성입니다. 솔의 강해진 취약점 탐지 능력은 국내 보안팀에게 강력한 방어 도구가 될 수 있지만, 같은 능력이 공격에도 쓰일 수 있다는 점에서 오픈AI의 다층 안전장치가 실제로 얼마나 잘 작동하는지가 관건입니다. 앞서 다룬 오픈AI의 '패치 더 플래닛'이나 정부의 'AI 사이버보안 클리어링하우스' 같은 시도와 함께, AI가 보안 지형을 어떻게 바꾸는지 국내 보안 업계도 주시할 필요가 있습니다.

정리하며

GPT-5.6 솔의 프리뷰는 두 가지 이야기를 동시에 담고 있습니다. 하나는 '더 강력하고 더 저렴한 모델'이라는 기술적 진전이고, 다른 하나는 **'최첨단 AI의 공개 방식이 더 이상 기업만의 결정이 아니게 됐다'**는 구조적 변화입니다. 오픈AI가 정부 검토 절차에 대해 드러낸 불편함은, 혁신 속도와 국가안보 사이에서 AI 기업들이 처한 긴장을 그대로 보여줍니다.

남는 질문은 이렇습니다. 강력한 AI의 능력을 '방어자에게 먼저' 닿게 하겠다는 약속은 실제로 지켜질 수 있을까요? 그리고 미국이 자국 기업의 최첨단 모델 공개까지 단계적으로 통제하는 흐름 속에서, 그 모델에 의존해온 한국 같은 나라들은 접근 시차와 공급 불안정을 어떻게 관리해야 할까요? GPT-5.6이 몇 주 뒤 일반 공개로 이어질 때, 이 질문들에 대한 첫 답이 드러나기 시작할 것입니다.

이 글은 오픈AI 공식 발표(2026년 6월 26일, openai.com)를 바탕으로, 백악관 행정명령 원문과 NPR·앤트로픽·펜윅 등 관련 자료를 참고해 작성되었습니다.