코딩하는 상인 블로그

DiffusionGemma 적용 전 점검할 리스크 감사표: 4배 빠른 텍스트 생성, 어디에 맞고 어디엔 안 맞나

Google DeepMind가 실험적 오픈 모델 DiffusionGemma를 공개했다. 최대 4배 빠른 텍스트 생성과 H100 기준 1000+ tokens/s가 핵심이지만, 공식 문서도 표준 Gemma 4보다 품질이 낮고 고QPS 클라우드 서빙 비용 이점이 줄 수 있다고 경고한다.

Google DeepMind·업데이트 2026.06.23한국 개발자공식 출처 확인됨