2026-04-28: GPT-5.5, Claude 4.7, Gemini 3.5

2026. 4. 28.

📅 요약 개요

최근 AI 커뮤니티는 GPT-5.5와 **Claude 4.7(Opus)**의 성능 비교, 그리고 곧 다가올 **Google I/O(5월 19-20일)**에서의 Gemini 3.5 발표 기대감으로 뜨겁습니다. 특히 OpenAI가 Microsoft Azure 외의 타 클라우드(TPU 등)를 사용할 수 있도록 파트너십을 변경했다는 소식이 큰 반향을 일으켰으며, 23세 일반인이 GPT-5.5를 활용해 60년 묵은 난제(Erdős 문제)를 해결했다는 소식이 화제입니다. 솔로 개발자들에게는 고비용 프론티어 모델을 기획(Planning)에 쓰고, 저비용/로컬 모델을 구현(Implementation)에 쓰는 전략이 주요 논점으로 다뤄졌습니다.

🔧 도구, 모델 & 기술 리소스

프론티어 모델 (최상위 성능):
- GPT-5.5: 코딩, 수학, 일반 추론에서 현재 가장 압도적이라는 평가. 특히 버그 수정 능력이 탁월함.
- Claude Opus 4.7: 4.6 대비 추론 능력이 향상되었으나 가격이 매우 비쌈(입력 $5/출력 $25). 복잡한 리액트 네이티브 메모리 누수 등을 잡는 데 강점.
- Gemini 3.1 Pro/Flash: 멀티모달(비전, 음성)과 긴 컨텍스트(1M+) 처리에서 여전히 강세.
오픈 소스/가성비 모델:
- DeepSeek-V4-Flash: 가격 대비 성능이 매우 뛰어나며, OpenRouter 등을 통해 저렴하게 이용 가능.
- Gemma 4 (31B): 로컬에서 돌리기 적합하며 비전 능력이 Gemini 2.5 Pro 수준으로 향상됨.
- GLM-5.1: 에이전트 성능(SWE)에서 GPT-5.4보다 낫다는 의견이 있음 (중국권 모델들의 약진).
- MiMo-V2.5-Pro: 1T(1조) 파라미터 규모의 MoE 모델이 오픈 소스로 공개됨.
개발 도구:
- Zed: VS Code보다 빠르고 가벼운 에디터로 언급됨.
- Aider: 에이전트 방식의 코딩 도구로 널리 사용 중.
- MCP (Model Context Protocol): Supabase가 MCP를 추가하여 LLM이 API를 더 쉽게 제어할 수 있게 됨.

💡 기법 & 모범 사례

비용 절감을 위한 ‘하이브리드 워크플로우’:
1. 기획 단계: GPT-5.5 또는 Gemini 3.1 Pro를 사용하여 상세 구현 계획(.md 파일)을 작성.
2. 구현 단계: 작성된 계획을 로컬 모델(Qwen 3.6, Gemma 4)이나 저렴한 API(DeepSeek, GLM)에 입력하여 코드 작성.
이미지 편집 팁: Grok의 이미지 모델은 간단한 포즈 변경이나 편집에 GPT Image 2보다 빠르고 정확할 때가 있음. 단, 복잡한 프롬프트 준수는 GPT가 우위.
성능 최적화: 로컬 모델 실행 시 MLX 최적화 버전(Apple 실리콘 기준)을 사용해야 성능 체감이 큼.

💼 비즈니스, 제품 & 시장 인사이트

OpenAI의 독립성 강화: MS와의 독점 파트너십이 종료됨에 따라 OpenAI가 구글의 TPU나 아마존의 Trainium 칩을 사용하여 모델을 학습/추론할 수 있게 됨. 이는 인프라 비용 절감으로 이어질 가능성이 큼.
AI 채용 시장의 편향성: 실험 결과, AI 채용 도구가 사람이 쓴 이력서보다 ChatGPT가 재작성한 이력서를 97.6% 확률로 더 선호함. 취업/이직 시 AI 최적화 재작성이 필수적임.
중국 시장의 변수: Meta의 Manus(AI 에이전트 스타트업) 인수가 중국 정부에 의해 저지됨. AI 스타트업들의 국가별 진영 구축이 심화될 전망.

⚠️ 주의사항, 이슈 & 피해야 할 것들

Claude 4.7의 가격 부담: 4.6 대비 비용이 2배 이상 높으므로, 단순 작업에는 4.6이나 Sonnet을 유지하는 것이 경제적임.
로컬 모델의 한계: 32B급 이하 로컬 모델은 복잡한 멀티 파일 리팩토링이나 고난도 아키텍처 설계에서 여전히 프론티어 모델을 대체하기 어려움.
GPT Image 2의 노이즈: 이미지 생성 시 특정 패턴(나무 등)에서 사이키델릭한 노이즈가 발생하는 이슈가 여전히 해결되지 않음.

🔗 공유된 링크 & 리소스

[GitHub] BenchForge: 로컬 및 클라우드 API 모델 성능을 벤치마킹하는 데스크톱 앱. (snakex21/BenchForge)
[GitHub] CLIProxyAPI: Gemini CLI, ChatGPT Codex 등을 OpenAI 호환 API로 변환해주는 프록시 서비스. (router-for-me/CLIProxyAPI)
[Gist] Karpathy의 LLM-Wiki: 안드레이 카파시가 제안한 LLM 기반 지식 관리 시스템 아이디어.
[Benchmark] KernelBench-Hard: 리눅스 커널 등 고난도 코드 이해력을 측정하는 신규 벤치마크 예고.

📌 실행 가능한 핵심 사항

Google I/O (5월 19-20일) 모니터링: Gemini 3.5 발표 시 코딩 에이전트 성능 변화를 즉시 테스트할 것.
가성비 API 교체 검토: 기존 Claude/GPT API 비용이 부담된다면 AWS Bedrock을 통한 GLM-5.1 또는 OpenRouter의 DeepSeek V4로의 교체 테스트 권장.
이력서/문서 최적화: AI가 읽는 문서(이력서, 제안서 등)는 반드시 최신 LLM을 통해 한 번 거른 후 제출할 것 (AI 선호도 반영).
로컬 개발 환경 구축: 간단한 자동 완성이나 파일 조회는 Qwen 2.5-Coder(32B)나 Gemma 4를 로컬에 띄워(Ollama 사용) API 비용을 최소화할 것.