2026-03-26: Sora 종료, Claude Code, ARC-AGI-3, LiteLLM 보안

2026. 3. 26.

📅 요약 개요

최근 AI 커뮤니티의 가장 큰 화두는 OpenAI의 Sora 서비스 종료 및 API 개발 중단 발표입니다. 이는 AI 비디오 생성 시장의 수익성 한계와 연산 자원의 효율적 배분(코딩 에이전트 및 차세대 모델 ‘Spud’ 집중)을 시사합니다. 한편, Anthropic은 **Claude Code의 ‘Auto Mode’**를 통해 에이전트 자동화의 실용성을 높였고, 새로운 벤치마크인 ARC-AGI-3가 공개되면서 기존 모델들의 실제 추론 능력(0.2~0.3% 수준의 낮은 점수)에 대한 냉정한 평가가 이어지고 있습니다.

🔧 도구, 모델 & 기술 리소스

Claude Code & Cowork: ‘Auto Mode’가 추가되어 사용자의 매번 승인 없이도 에이전트가 권한 결정을 내릴 수 있게 됨. ‘Cowork’는 샌드박스 환경에서 작동하여 보안성을 강화함.
LiteLLM 보안 위기: PyPI 공급망 공격(Supply Chain Attack) 발생. 버전 1.82.7 및 1.82.8이 침해된 것으로 보고됨. (Aider는 현재 구버전 사용 중이라 안전한 것으로 파악됨).
Google Gemini 3.1 & Lyria 3: Gemini 3.1 Flash/Pro가 업데이트되었으며, 음악 생성 모델인 Lyria 3 Pro가 출시됨. 특히 Gemini 3.1은 ARC-AGI-3에서 미세하게 선두를 달리고 있음.
Qwen 3.5 시리즈: Qwen3.5-27B 및 397B 모델에 대한 Aider 벤치마크 결과 공유. BF16 및 특정 VLLM 설정 최적화 시 76% 수준의 Pass@2 달성 보고.
TurboQuant: LLM의 Key-Value 캐시 메모리를 6배 줄이고 속도를 8배 높이는 구글의 새로운 압축 알고리즘 공개.

💡 기법 & 모범 사례

3D 에셋 생성 팁: 단순 텍스트 프롬프트보다 SDF(Signed Distance Function)를 생성하게 한 뒤 메쉬로 변환하거나, Three.js를 이용해 폴리곤을 직접 구축하도록 유도하는 것이 품질이 더 높음.
에이전트 제어: Claude Code 사용 시 --dangerously-skip-permissions 옵션을 사용하되, 디렉토리 파괴 등을 방지하기 위해 반드시 샌드박스 환경(Claude Cowork 등)을 병행할 것.
로컬 모델 활용: Roocode가 로컬 모델(Qwen 3.5 등)의 도구 호출(Tool use)에서 높은 안정성을 보인다는 사용자 평이 많음.

💼 비즈니스, 제품 & 시장 인사이트

비디오 생성 시장의 지각변동: OpenAI의 Sora 포기는 연산 비용 대비 수익성이 낮기 때문으로 분석됨. 현재 이 시장은 중국의 Seedance 2.0이 기술적/비용적으로 우위를 점하고 있음.
OpenAI vs Anthropic 수익성: Anthropic의 매출 성장세가 OpenAI를 위협할 정도로 가파름(주간 30% 성장설 언급). OpenAI는 단순 생성(Slop)에서 코딩/연구용 에이전트로 전사적 역량을 재편 중.
SaaS 구독 모델의 한계: Claude Pro/Max 등 구독제의 사용량 제한(Rate Limit)에 대한 불만이 높으며, 많은 전문 개발자들이 API 캐싱 기능을 활용한 결제 방식으로 회귀 중.

⚠️ 주의사항, 이슈 & 피해야 할 것들

보안 주의: LiteLLM 라이브러리를 사용 중이라면 즉시 버전을 확인하고 침해 여부를 점검할 것. 환경 변수(ENV) 및 API Key 탈취 위험이 있음.
벤치마크의 함정: 모델들이 ARC-AGI 1, 2 등에 대해 ‘벤치맥싱(데이터 오염을 통한 점수 부풀리기)‘을 하고 있다는 비판이 있음. 신규 벤치마크인 ARC-AGI-3의 결과가 모델의 실제 지능에 더 가까울 수 있음.
Grok Image 유료화: Grok의 이미지 생성 기능이 전면 유료화되었으며, 무료 계정의 사용 제한이 강화됨.

🔗 공유된 링크 & 리소스

보안: LiteLLM PyPI 공급망 공격 상세 내용
벤치마크: ARC-AGI-3 기술 보고서 / Riemann-bench (수학 벤치마크)
기술 블로그: Anthropic의 Harness Design 가이드
오픈 소스: MolmoWeb (웹 에이전트 데이터셋/모델) / LTX-2.3 (오픈 비디오 모델)

📌 실행 가능한 핵심 사항

보안 점검: 프로젝트에서 LiteLLM을 사용 중이라면 즉시 의존성을 확인하고 보안 패치를 진행하십시오.
워크플로우 최적화: Claude Code의 Auto Mode를 도입하여 반복적인 파일 쓰기/실행 승인 단계를 줄여 개발 속도를 높이십시오.
모델 전환 고려: 비디오 생성 기능이 필요한 경우 Sora 대신 중국의 Seedance 2.0이나 오픈 소스인 LTX-2.3을 대안으로 검토하십시오.
성능 평가: 제품의 지능을 테스트할 때 기존 벤치마크 대신 ARC-AGI-3의 문제를 활용하여 모델의 실제 일반화 능력을 측정해 보십시오.