사카나 AI '후구(Fugu)' 출시 — 'AI 모델 하나에 올인하는 시대는 끝났다'는 선언
일본의 AI 기업 사카나 AI(Sakana AI)가 2026년 6월 22일, 새로운 AI 제품 **'후구(Fugu)'**를 정식 출시
사카나 AI '후구(Fugu)' 출시 — 'AI 모델 하나에 올인하는 시대는 끝났다'는 선언
일본의 AI 기업 사카나 AI(Sakana AI)가 2026년 6월 22일, 새로운 AI 제품 **'후구(Fugu)'**를 정식 출시했습니다. 이름이 일본어로 복어를 뜻하는 이 제품의 핵심 아이디어는 한 문장으로 요약됩니다. "가장 똑똑한 하나의 거대 모델을 만드는 대신, 세상에서 가장 뛰어난 여러 모델을 상황에 맞게 골라 쓰도록 지휘하는 모델을 만든다."
겉으로 보면 후구는 그냥 하나의 API입니다. 사용자가 요청을 보내면 후구가 알아서 처리하죠. 그런데 그 내부에서는 여러 전문 AI 모델로 구성된 '팀'이 작업을 나눠 맡고, 후구가 지휘자처럼 누구에게 무엇을 시킬지 결정합니다. 이런 구조를 멀티에이전트 오케스트레이션(multi-agent orchestration)이라고 부르는데, 후구는 이 복잡한 시스템 전체를 '단일 모델처럼' 쓸 수 있게 포장한 제품입니다.
이 발표가 단순한 신제품 출시 이상의 의미를 갖는 이유는, 사카나 AI가 내세운 명분이 기술이 아니라 'AI 주권(AI sovereignty)'과 단일 벤더 의존의 위험이기 때문입니다. 왜 일본 기업이 이 시점에 이런 메시지를 들고 나왔는지, 그 배경부터 짚어보겠습니다.
왜 지금 '오케스트레이션'인가 — 직전에 벌어진 사건
후구의 출시 논리를 이해하려면, 불과 열흘 전 AI 업계를 흔든 한 사건을 알아야 합니다.
2026년 6월 12일, 미국 정부는 국가안보를 이유로 앤트로픽(Anthropic)의 최신 AI 모델 '페이블 5(Fable 5)'와 '미토스 5(Mythos 5)'에 대해 수출 통제 명령을 내렸습니다. 이 명령은 미국 내외를 막론하고 모든 외국인의 접근을 금지하는 것이었고, 심지어 앤트로픽의 외국인 직원까지 포함됐습니다. 결국 앤트로픽은 두 모델을 전 세계 모든 고객에게서 갑자기 내려야 했습니다. AWS, 구글 클라우드, 마이크로소프트 등 모든 플랫폼에서 동시에요.
이 사건이 업계에 던진 충격은 분명했습니다. 특정 회사의 AI 하나에 핵심 업무를 의존하고 있었다면, 어느 날 오후 정부 명령 한 장에 그 서비스가 통째로 사라질 수 있다는 현실이 입증된 것입니다. 규제, 수출 통제, 외교 정책이 바뀌면 접근 권한이 하룻밤 사이에 증발할 수 있다는 뜻이죠.
사카나 AI는 후구 발표문에서 바로 이 사건을 직접 인용하며, "단일 벤더 의존은 더 이상 가설이 아니라 현실의 취약점"이라고 못 박았습니다. 후구의 해법은 이렇습니다. 후구는 여러 모델을 언제든 교체 가능한 부품처럼 다루기 때문에, 한 공급자가 접근을 막아도 다른 모델로 동적으로 우회합니다. 회사는 이것을 "AI 주권을 위한 현실적이고 회복력 있는 청사진"이라고 표현했습니다.
후구는 정확히 무엇을 하나
후구의 가장 독특한 점은, 그 자체가 '지휘하는 법'을 학습한 언어 모델이라는 데 있습니다. 사람이 "이 작업은 A 모델, 저 작업은 B 모델"이라고 규칙을 미리 짜두는 게 아니라, 언제 작업을 위임할지·에이전트들이 어떻게 소통할지·결과를 어떻게 하나의 신뢰할 만한 답으로 합칠지를 후구가 스스로 판단합니다. 심지어 자기 자신을 재귀적으로 호출하기도 합니다.
작동 방식은 이렇습니다.
- 사용자는 하나의 엔드포인트에 요청을 보냅니다.
- 후구가 판단합니다. 간단하면 직접 풀고, 복잡하면 전문 모델들로 팀을 꾸립니다.
- 모델 선택, 작업 위임, 검증, 종합을 전부 내부에서 처리합니다.
- 사용자 코드에는 멀티에이전트 시스템의 복잡함이 전혀 노출되지 않습니다.
이 접근은 사카나 AI가 ICLR 2026에 발표한 연구 '트리니티(Trinity)'와 '컨덕터(Conductor)' — 모델 오케스트레이션을 학습으로 푸는 방법론 — 위에 세워졌습니다. 또 하나 눈에 띄는 점은 후구가 OpenAI 호환 API를 쓴다는 것입니다. 기존에 챗GPT API를 쓰던 개발자라면 코드를 거의 바꾸지 않고 후구로 갈아탈 수 있다는 의미입니다.
두 가지 모델: 후구와 후구 울트라
출시 시점에 후구는 두 가지로 나뉩니다.
- 후구(Fugu): 성능과 응답 속도의 균형을 맞춘 기본 모델입니다. 코드 작성·리뷰 도구(코덱스 등)나 챗봇 같은 일상적·대화형 서비스에 적합합니다. 데이터·프라이버시·규정 준수가 중요한 팀은 특정 에이전트를 풀에서 제외할 수도 있습니다.
- 후구 울트라(Fugu Ultra): 어렵고 여러 단계를 거치는 문제에서 답변 품질을 최대로 끌어올린 모델입니다. AI 연구, 논문 재현, 사이버보안 분석, 문헌·특허 조사처럼 정확성과 깊이가 중요한 작업에 쓰입니다.
성능 면에서 사카나 AI가 내세우는 핵심 주장은 이것입니다. 후구 울트라가 앤트로픽의 페이블 5, 미토스 프리뷰 같은 최정상급 모델과 어깨를 나란히 하면서도, 수출 통제 리스크는 없다는 것입니다. 흥미롭게도 페이블 5와 미토스는 일반에 공개되지 않아 후구의 에이전트 풀에 들어가 있지도 않은데, 그럼에도 비등한 성능을 낸다는 게 회사 설명입니다. 또 자체 실험에서는 데이터 분석, 루빅스 큐브, 기계 설계, 일본어 손글씨 분석, 체스, 금융 시계열 예측 등 다양한 작업에서 제미나이 3.1 프로, 클로드 오푸스 4.8, GPT-5.5 같은 프론티어 모델을 꾸준히 앞섰다고 밝혔습니다.
다만 이 수치들은 사카나 AI가 자체 측정해 발표한 값이고, 비교 대상 모델들의 점수는 각 제공사가 공개한 값을 가져온 것입니다. 벤치마크는 어디까지나 참고치이며, 독립적인 제3자 검증은 별개라는 점은 감안할 필요가 있습니다.
실제 사용자들은 무엇을 만들었나
사카나 AI는 정식 출시 전 약 500명의 베타 사용자와 함께 후구를 다듬었습니다. 이들이 강조한 후구의 강점은 '한 번의 질문에 더 나은 답'이 아니라, 길고 지저분한 실제 업무를 여러 단계에 걸쳐 끝까지 끌고 가는 능력이었습니다.
발표문에 소개된 사용자 후기 중 인상적인 사례를 보면, 한 소프트웨어 엔지니어는 코드 리뷰에서 다른 도구가 3건 정도 짚어내는 문제를 후구는 20건 넘게 찾아냈다고 평했습니다. 한 사이버보안 엔지니어는 범위를 좁힌 지시 하나만으로 후구가 정찰부터 취약점 검사, 인증 검토, 증거와 재테스트 절차를 담은 보고서 작성까지 — 지정한 범위를 벗어나지 않고 시스템을 망가뜨리는 행동도 피하면서 — 보안 평가 전 과정을 처리했다고 전했습니다. 또 어떤 사용자는 후구를 거의 완전 자동 연구 모드로 돌려, 사람이 거의 개입하지 않아도 데이터 분석 연구가 의미 있게 진척되는 것을 확인했다고 합니다.
이런 사례들의 공통점은 명확합니다. 단일 모델 한 번 호출로는 풀기 어려운, 길고 복잡하며 중간에 실패와 수정을 반복해야 하는 작업일수록 멀티에이전트 오케스트레이션의 가치가 커진다는 것입니다.
한국 독자에게 어떤 의미가 있을까
이 소식은 한국의 개발자, 기업, 그리고 AI 정책 담당자 모두에게 시사하는 바가 있습니다.
먼저 AI 인프라 전략의 관점입니다. 후구가 던지는 메시지의 핵심은 "하나의 해외 AI 모델에 핵심 업무를 몰아주는 것은 위험하다"는 것인데, 이는 한국 기업에게 특히 와닿는 이야기입니다. 국내 상당수 서비스가 오픈AI, 앤트로픽, 구글 같은 미국 빅테크의 API에 의존하고 있고, 앞서 본 앤트로픽 수출 통제 사건처럼 미국의 정책 변화가 곧바로 한국 기업의 서비스 중단으로 이어질 수 있다는 위험은 이미 현실입니다. 여러 모델을 갈아 끼울 수 있는 오케스트레이션 구조는 이 위험을 줄이는 하나의 대안이 될 수 있습니다.
다음으로 'AI 주권' 논의입니다. 사카나 AI가 일본 기업으로서 이 카드를 들고 나온 것은 의미심장합니다. 자국 AI 역량을 어떻게 확보할 것인가는 한국에서도 활발히 논의되는 주제인데, '거대 자체 모델을 직접 만든다'는 길 외에 '세계 최고 모델들을 조율해 쓰는 능력을 확보한다'는 또 다른 길을 제시한 셈입니다. 막대한 비용을 들여 프론티어 모델을 처음부터 개발하기 어려운 기업이나 국가에게는 현실적인 선택지로 보일 수 있습니다.
물론 따져볼 지점도 있습니다. 후구 역시 결국 '사카나 AI라는 또 다른 단일 벤더'를 거치는 구조입니다. 내부 모델은 교체 가능하다지만, 오케스트레이션 계층 자체에 의존하게 되는 것은 마찬가지죠. 또 여러 모델을 거쳐 작업하는 만큼 비용과 지연(latency) 구조가 어떻게 되는지, 민감한 데이터가 여러 외부 모델을 오갈 때 보안은 어떻게 보장되는지도 실무 도입 전 꼼꼼히 따져야 할 부분입니다.
정리하며
후구의 출시는 'AI 경쟁이 더 큰 모델 만들기에서 다른 국면으로 넘어가고 있다'는 신호로 읽힙니다. 지난 몇 년간 AI 발전은 "더 크고, 더 많은 데이터로 훈련한 단일 모델"이 이끌었습니다. 사카나 AI는 그 흐름의 다음 단계로 "어떤 모델을 언제 어떻게 조합할지 아는 능력" 자체를 하나의 제품으로 내놓은 것입니다.
남는 질문은 이렇습니다. AI의 가치가 '가장 똑똑한 단일 모델'에서 '여러 모델을 가장 잘 지휘하는 능력'으로 옮겨간다면, 프론티어 모델을 직접 만드는 기업과 그것을 조율해 쓰는 기업 사이의 힘의 균형은 어떻게 달라질까요? 그리고 단일 벤더 의존의 위험을 피하려는 시도가, 역설적으로 '오케스트레이션 계층'이라는 새로운 의존을 만들어내지는 않을까요? 후구가 실제 업무 현장에서 이 약속을 얼마나 지켜낼지가, 이 질문들에 대한 답이 될 것입니다.
이 글은 사카나 AI 공식 발표(2026년 6월 22일, sakana.ai)와 관련 보도를 바탕으로 작성되었습니다.
참고 출처
공식 1 · 보조 0- 사카나 AI공식