2026-03-26: Sora 종료, Claude Code, ARC-AGI-3, LiteLLM 보안
2026. 3. 26.
📅 요약 개요
최근 AI 커뮤니티의 가장 큰 화두는 OpenAI의 Sora 서비스 종료 및 API 개발 중단 발표입니다. 이는 AI 비디오 생성 시장의 수익성 한계와 연산 자원의 효율적 배분(코딩 에이전트 및 차세대 모델 ‘Spud’ 집중)을 시사합니다. 한편, Anthropic은 **Claude Code의 ‘Auto Mode’**를 통해 에이전트 자동화의 실용성을 높였고, 새로운 벤치마크인 ARC-AGI-3가 공개되면서 기존 모델들의 실제 추론 능력(0.2~0.3% 수준의 낮은 점수)에 대한 냉정한 평가가 이어지고 있습니다.
🔧 도구, 모델 & 기술 리소스
- Claude Code & Cowork: ‘Auto Mode’가 추가되어 사용자의 매번 승인 없이도 에이전트가 권한 결정을 내릴 수 있게 됨. ‘Cowork’는 샌드박스 환경에서 작동하여 보안성을 강화함.
- LiteLLM 보안 위기: PyPI 공급망 공격(Supply Chain Attack) 발생. 버전
1.82.7및1.82.8이 침해된 것으로 보고됨. (Aider는 현재 구버전 사용 중이라 안전한 것으로 파악됨). - Google Gemini 3.1 & Lyria 3: Gemini 3.1 Flash/Pro가 업데이트되었으며, 음악 생성 모델인 Lyria 3 Pro가 출시됨. 특히 Gemini 3.1은 ARC-AGI-3에서 미세하게 선두를 달리고 있음.
- Qwen 3.5 시리즈:
Qwen3.5-27B및397B모델에 대한 Aider 벤치마크 결과 공유. BF16 및 특정 VLLM 설정 최적화 시 76% 수준의 Pass@2 달성 보고. - TurboQuant: LLM의 Key-Value 캐시 메모리를 6배 줄이고 속도를 8배 높이는 구글의 새로운 압축 알고리즘 공개.
💡 기법 & 모범 사례
- 3D 에셋 생성 팁: 단순 텍스트 프롬프트보다
SDF(Signed Distance Function)를 생성하게 한 뒤 메쉬로 변환하거나,Three.js를 이용해 폴리곤을 직접 구축하도록 유도하는 것이 품질이 더 높음. - 에이전트 제어: Claude Code 사용 시
--dangerously-skip-permissions옵션을 사용하되, 디렉토리 파괴 등을 방지하기 위해 반드시 샌드박스 환경(Claude Cowork 등)을 병행할 것. - 로컬 모델 활용:
Roocode가 로컬 모델(Qwen 3.5 등)의 도구 호출(Tool use)에서 높은 안정성을 보인다는 사용자 평이 많음.
💼 비즈니스, 제품 & 시장 인사이트
- 비디오 생성 시장의 지각변동: OpenAI의 Sora 포기는 연산 비용 대비 수익성이 낮기 때문으로 분석됨. 현재 이 시장은 중국의 Seedance 2.0이 기술적/비용적으로 우위를 점하고 있음.
- OpenAI vs Anthropic 수익성: Anthropic의 매출 성장세가 OpenAI를 위협할 정도로 가파름(주간 30% 성장설 언급). OpenAI는 단순 생성(Slop)에서 코딩/연구용 에이전트로 전사적 역량을 재편 중.
- SaaS 구독 모델의 한계: Claude Pro/Max 등 구독제의 사용량 제한(Rate Limit)에 대한 불만이 높으며, 많은 전문 개발자들이 API 캐싱 기능을 활용한 결제 방식으로 회귀 중.
⚠️ 주의사항, 이슈 & 피해야 할 것들
- 보안 주의: LiteLLM 라이브러리를 사용 중이라면 즉시 버전을 확인하고 침해 여부를 점검할 것. 환경 변수(
ENV) 및 API Key 탈취 위험이 있음. - 벤치마크의 함정: 모델들이 ARC-AGI 1, 2 등에 대해 ‘벤치맥싱(데이터 오염을 통한 점수 부풀리기)‘을 하고 있다는 비판이 있음. 신규 벤치마크인 ARC-AGI-3의 결과가 모델의 실제 지능에 더 가까울 수 있음.
- Grok Image 유료화: Grok의 이미지 생성 기능이 전면 유료화되었으며, 무료 계정의 사용 제한이 강화됨.
🔗 공유된 링크 & 리소스
- 보안: LiteLLM PyPI 공급망 공격 상세 내용
- 벤치마크: ARC-AGI-3 기술 보고서 / Riemann-bench (수학 벤치마크)
- 기술 블로그: Anthropic의 Harness Design 가이드
- 오픈 소스: MolmoWeb (웹 에이전트 데이터셋/모델) / LTX-2.3 (오픈 비디오 모델)
📌 실행 가능한 핵심 사항
- 보안 점검: 프로젝트에서 LiteLLM을 사용 중이라면 즉시 의존성을 확인하고 보안 패치를 진행하십시오.
- 워크플로우 최적화: Claude Code의 Auto Mode를 도입하여 반복적인 파일 쓰기/실행 승인 단계를 줄여 개발 속도를 높이십시오.
- 모델 전환 고려: 비디오 생성 기능이 필요한 경우 Sora 대신 중국의 Seedance 2.0이나 오픈 소스인 LTX-2.3을 대안으로 검토하십시오.
- 성능 평가: 제품의 지능을 테스트할 때 기존 벤치마크 대신 ARC-AGI-3의 문제를 활용하여 모델의 실제 일반화 능력을 측정해 보십시오.