2026-03-21: 커서 컴포저 2, 키미 K2.5, 구글 AI 스튜디오, GLM-5, 에이전틱 워크플로우
2026. 3. 21.
📅 요약 개요
최근 AI 개발 커뮤니티는 Cursor의 Composer 2 출시와 그 이면에 숨겨진 Kimi K2.5 모델 재포장(Rebadging) 논란으로 뜨겁습니다. 한편, Google은 AI Studio에 강력한 풀스택 개발 기능을 추가하며 ‘바이브 코딩(Vibe Coding)’ 시장을 정조준하고 있습니다. 또한 GLM-5, Qwen 3.5 Max 등 중국발 고성능 모델들이 벤치마크 상위권을 점령하며 오픈소스와 독자 모델 사이의 경계가 모호해지는 양상을 보이고 있습니다.
🔧 도구, 모델 & 기술 리소스
- Cursor Composer 2 & Glass UI: 새로운 에이전틱 인터페이스인 ‘Glass’와 함께 출시되었습니다. 하지만 Composer 2가 중국 문샷 AI(Moonshot AI)의 Kimi K2.5 모델에 RL(강화학습)을 추가한 것이라는 사실이 드러나며 라이선스 준수 여부가 논란이 되고 있습니다.
- Google AI Studio 업데이트: 데이터베이스(One-click DB), Google 로그인 연동, 멀티플레이어 지원, shadcn 및 Framer Motion 라이브러리 기본 지원 등 풀스택 앱 개발이 가능한 수준으로 업그레이드되었습니다.
- 주요 신규 모델:
- Qwen 3.5 Max Preview: 수학(Math) 분야에서 특히 강력한 성능을 보이며 아레나 상위권 진입.
- GLM-5: Aider 벤치마크에서 매우 높은 성능(Pass rate)을 기록 중이며, NVFP4 양자화 변형 모델이 공유되었습니다.
- UNI-1 (Luma AI): 추론 능력과 시각적 상상력을 결합한 새로운 모델.
- MAI-Image-2 (Microsoft): 이미지 생성 아레나에서 상위 5위에 진입한 신규 모델.
- 하드웨어: AMD MI300/MI355X GPU에서 vLLM 및 SGLang이 큰 충돌 없이 작동한다는 사용자 경험이 공유되었습니다.
💡 기법 & 모범 사례
- 효율적인 기획-구현 프로세스: 가장 강력한 모델(예: GPT-5.4 Pro)을 사용하여 **코그니티브 레그워크(기획 및 설계)**를 수행한 뒤, 실제 코드 구현은 더 저렴한 모델(예: Mini 시리즈)에 명확한 지침을 전달하는 방식이 권장됩니다.
- 에이전트 오케스트레이션 프레임워크: 리뷰어(Reviewer), 오퍼레이터(Operator), 스카우트(Scout)로 역할을 분할한 멀티 에이전트 구조가 효과적이라는 분석입니다.
- 초장기 컨텍스트 관리: MSA(Memory Sparse Attention) 기법을 통해 1억(100M) 토큰 수준의 컨텍스트에서도 성능 저하를 최소화할 수 있는 가능성이 논의되었습니다.
💼 비즈니스, 제품 & 시장 인사이트
- 오픈소스 모델의 역습: 중국 AI 랩들이 Claude나 GPT-4를 증류(Distilling)하여 고성능 모델을 내놓고 있으며, 이들이 곧 오픈소스로 풀릴 예정(GLM-5.1 등)이라 시장 경쟁이 더 치열해질 전망입니다.
- OpenAI의 통합 전략: OpenAI가 ChatGPT, Codex, 브라우저를 하나로 통합한 **‘슈퍼앱(Superapp)‘**을 준비 중이며, 컴퓨터에서 자율적으로 작동하는 에이전틱 AI에 집중하고 있다는 내부 메모가 유출되었습니다.
- 코딩 도구의 독자 모델 경쟁: Cursor와 같은 도구들이 기존 API 래퍼를 넘어 독자적인 파인튜닝 모델을 통해 ‘락인(Lock-in)’ 효과를 극대화하려 하고 있습니다.
⚠️ 주의사항, 이슈 & 피해야 할 것들
- 벤치마크의 함정: 최근 발표된 ‘EsoLang-Bench’(Brainfuck 같은 난해한 언어 테스트)에서 모델들이 0%를 기록했다는 발표가 있었으나, 이는 최대 토큰 제한이나 에이전트 설정 오류 때문이라는 반박이 제기되었습니다(Claude 3.5 등은 실제 해결 가능).
- 라이선스 리스크: Kimi K2.5와 같은 모델을 사용할 때 월 매출 2천만 달러 이상이거나 MAU가 1억 명 이상인 경우 모델 이름을 명시해야 하는 특수 MIT 라이선스 조항이 있으니 주의가 필요합니다.
- 커뮤니티 보안: 디스코드 내 계정 사칭 및 해킹 사건이 빈번하므로 중요 액세스 권한 관리에 유의해야 합니다.
🔗 공유된 링크 & 리소스
- GitHub (MSA): EverMind-AI/MSA - 초장기 메모리 기술.
- GitHub (Itera): Cosmic-Game-studios/Itera - 코딩 에이전트 자가 개선 시스템.
- 도구: Cursor Glass, Claude Code Channels (텔레그램/디스코드 연동 도구).
📌 실행 가능한 핵심 사항
- 풀스택 MVP 개발: Google AI Studio의 새로운 ‘디자인 모드’와 DB 연동 기능을 활용해 프로토타입을 빠르게 제작해 보십시오.
- 모바일 에이전트 제어: Claude Code의 새로운 채널 기능을 이용해 텔레그램이나 디스코드로 코딩 에이전트를 모바일에서 원격 제어하는 환경을 구축해 보십시오.
- 모델 믹스 전략: 단순 코딩은 저렴한 중국발 오픈소스 모델(GLM, Qwen)을 활용하고, 복잡한 로직 설계는 상위권 추론 모델을 사용하는 하이브리드 전략으로 비용을 최적화하십시오.
- 라이브러리 활용: 에이전트 성능을 높이기 위해
~/.codex/AGENTS.md나 커스텀 시스템 프롬프트 설정을 최적화하십시오.