2026-03-21: 커서 컴포저 2, 키미 K2.5, 구글 AI 스튜디오, GLM-5, 에이전틱 워크플로우

2026. 3. 21.

📅 요약 개요

최근 AI 개발 커뮤니티는 Cursor의 Composer 2 출시와 그 이면에 숨겨진 Kimi K2.5 모델 재포장(Rebadging) 논란으로 뜨겁습니다. 한편, Google은 AI Studio에 강력한 풀스택 개발 기능을 추가하며 ‘바이브 코딩(Vibe Coding)’ 시장을 정조준하고 있습니다. 또한 GLM-5, Qwen 3.5 Max 등 중국발 고성능 모델들이 벤치마크 상위권을 점령하며 오픈소스와 독자 모델 사이의 경계가 모호해지는 양상을 보이고 있습니다.

🔧 도구, 모델 & 기술 리소스

Cursor Composer 2 & Glass UI: 새로운 에이전틱 인터페이스인 ‘Glass’와 함께 출시되었습니다. 하지만 Composer 2가 중국 문샷 AI(Moonshot AI)의 Kimi K2.5 모델에 RL(강화학습)을 추가한 것이라는 사실이 드러나며 라이선스 준수 여부가 논란이 되고 있습니다.
Google AI Studio 업데이트: 데이터베이스(One-click DB), Google 로그인 연동, 멀티플레이어 지원, shadcn 및 Framer Motion 라이브러리 기본 지원 등 풀스택 앱 개발이 가능한 수준으로 업그레이드되었습니다.
주요 신규 모델:
- Qwen 3.5 Max Preview: 수학(Math) 분야에서 특히 강력한 성능을 보이며 아레나 상위권 진입.
- GLM-5: Aider 벤치마크에서 매우 높은 성능(Pass rate)을 기록 중이며, NVFP4 양자화 변형 모델이 공유되었습니다.
- UNI-1 (Luma AI): 추론 능력과 시각적 상상력을 결합한 새로운 모델.
- MAI-Image-2 (Microsoft): 이미지 생성 아레나에서 상위 5위에 진입한 신규 모델.
하드웨어: AMD MI300/MI355X GPU에서 vLLM 및 SGLang이 큰 충돌 없이 작동한다는 사용자 경험이 공유되었습니다.

💡 기법 & 모범 사례

효율적인 기획-구현 프로세스: 가장 강력한 모델(예: GPT-5.4 Pro)을 사용하여 **코그니티브 레그워크(기획 및 설계)**를 수행한 뒤, 실제 코드 구현은 더 저렴한 모델(예: Mini 시리즈)에 명확한 지침을 전달하는 방식이 권장됩니다.
에이전트 오케스트레이션 프레임워크: 리뷰어(Reviewer), 오퍼레이터(Operator), 스카우트(Scout)로 역할을 분할한 멀티 에이전트 구조가 효과적이라는 분석입니다.
초장기 컨텍스트 관리: MSA(Memory Sparse Attention) 기법을 통해 1억(100M) 토큰 수준의 컨텍스트에서도 성능 저하를 최소화할 수 있는 가능성이 논의되었습니다.

💼 비즈니스, 제품 & 시장 인사이트

오픈소스 모델의 역습: 중국 AI 랩들이 Claude나 GPT-4를 증류(Distilling)하여 고성능 모델을 내놓고 있으며, 이들이 곧 오픈소스로 풀릴 예정(GLM-5.1 등)이라 시장 경쟁이 더 치열해질 전망입니다.
OpenAI의 통합 전략: OpenAI가 ChatGPT, Codex, 브라우저를 하나로 통합한 **‘슈퍼앱(Superapp)‘**을 준비 중이며, 컴퓨터에서 자율적으로 작동하는 에이전틱 AI에 집중하고 있다는 내부 메모가 유출되었습니다.
코딩 도구의 독자 모델 경쟁: Cursor와 같은 도구들이 기존 API 래퍼를 넘어 독자적인 파인튜닝 모델을 통해 ‘락인(Lock-in)’ 효과를 극대화하려 하고 있습니다.

⚠️ 주의사항, 이슈 & 피해야 할 것들

벤치마크의 함정: 최근 발표된 ‘EsoLang-Bench’(Brainfuck 같은 난해한 언어 테스트)에서 모델들이 0%를 기록했다는 발표가 있었으나, 이는 최대 토큰 제한이나 에이전트 설정 오류 때문이라는 반박이 제기되었습니다(Claude 3.5 등은 실제 해결 가능).
라이선스 리스크: Kimi K2.5와 같은 모델을 사용할 때 월 매출 2천만 달러 이상이거나 MAU가 1억 명 이상인 경우 모델 이름을 명시해야 하는 특수 MIT 라이선스 조항이 있으니 주의가 필요합니다.
커뮤니티 보안: 디스코드 내 계정 사칭 및 해킹 사건이 빈번하므로 중요 액세스 권한 관리에 유의해야 합니다.

🔗 공유된 링크 & 리소스

GitHub (MSA): EverMind-AI/MSA - 초장기 메모리 기술.
GitHub (Itera): Cosmic-Game-studios/Itera - 코딩 에이전트 자가 개선 시스템.
도구: Cursor Glass, Claude Code Channels (텔레그램/디스코드 연동 도구).

📌 실행 가능한 핵심 사항

풀스택 MVP 개발: Google AI Studio의 새로운 ‘디자인 모드’와 DB 연동 기능을 활용해 프로토타입을 빠르게 제작해 보십시오.
모바일 에이전트 제어: Claude Code의 새로운 채널 기능을 이용해 텔레그램이나 디스코드로 코딩 에이전트를 모바일에서 원격 제어하는 환경을 구축해 보십시오.
모델 믹스 전략: 단순 코딩은 저렴한 중국발 오픈소스 모델(GLM, Qwen)을 활용하고, 복잡한 로직 설계는 상위권 추론 모델을 사용하는 하이브리드 전략으로 비용을 최적화하십시오.
라이브러리 활용: 에이전트 성능을 높이기 위해 ~/.codex/AGENTS.md나 커스텀 시스템 프롬프트 설정을 최적화하십시오.