2026-01-20: Gemini 3 Pro GA, GLM 4.7 Flash, 에이전트 최적화

2026. 1. 20.

📅 요약 개요

이번 대화의 핵심은 구글의 Gemini 3 Pro GA 및 Flash 모델의 A/B 테스트 소식과 중국 Zhipu AI(현 Z.ai)의 신규 모델 GLM 4.7 Flash 출시에 집중되어 있습니다. 또한, Claude Code와 Opencode 같은 CLI 기반 코딩 에이전트의 실질적인 활용 팁과 인프라 측면에서의 추론 비용 구조, xAI의 Colossus 2 가동 등 하드웨어 및 비즈니스 인사이트가 활발히 공유되었습니다.

🔧 도구, 모델 & 기술 리소스

Gemini 3 Pro GA / Flash: AI Studio에서 새로운 체크포인트가 A/B 테스트 중입니다. 특히 비전 성능이 크게 향상되어 6세 아동 수준의 시각 인지 능력을 넘어섰다는 벤치마크가 언급되었습니다.
GLM 4.7 Flash: Z.ai에서 출시한 30B(또는 10B 추정) 규모의 모델로, 로컬 4060 GPU 환경에서도 구동 가능합니다. 코딩 성능이 체급 대비 매우 뛰어나다는 평가입니다.
Step3-VL-10B: 10B 파라미터로 Gemini 2.5 Pro에 필적하는 멀티모달 성능을 보여주는 신규 모델입니다.
CoreML 가속: 로컬 Mac 환경에서 모델을 CoreML로 변환하여 구동할 경우, 처리 속도가 약 6~10배 향상된다는 실무 경험이 공유되었습니다.
Sandpack: 브라우저 내에서 npm 설치 없이 빠르게 프런트엔드 코드를 실행하고 프리뷰할 수 있는 도구로 추천되었습니다.

💡 팁, 기법 & 모범 사례

에이전트 프롬프트 커스텀: Opencode 사용 시 내장된 Gemini 프롬프트가 노후화되어 도구 호출(tool call) 오류가 잦습니다. 이를 Anthropic의 시스템 프롬프트 스타일로 수정하면 성능과 신뢰도가 비약적으로 상승합니다.
저대역폭 환경 대응: 앱 개발 시 15kb/s 수준의 극단적인 저대역폭 환경에서 네트워크 요청 처리를 테스트하십시오. 많은 현대적 앱들이 연결 상태가 불안정할 때 무한 루프나 오류에 빠지는 취약점이 있습니다.
Claude API 활용: 컨텍스트 편집(Context Editing)과 메모리 도구를 적절히 구성하면 컨텍스트 오류를 줄이고 정확한 에이전트 실행이 가능합니다.

💼 비즈니스, 제품 & 시장 인사이트

추론 인프라 경쟁: OpenAI가 Cerebras와 750MW 규모의 계약을 체결했습니다. Cerebras는 수평 확장은 어렵지만, 단일 칩 성능이 압도적이라 RL(강화 학습) 및 빠른 추론에 유리합니다.
xAI Colossus 2: 2026년 1월 중순부터 기가와트 급의 두 번째 슈퍼클러스터 가동이 확인되었습니다. Grok 5 등의 훈련에 사용될 예정입니다.
중국 AI 기업의 약진: Zhipu AI가 Z.ai로 리브랜딩하고 성공적으로 IPO를 마쳤으며, 딥시크(DeepSeek) v4에 대한 기대감과 동시에 가짜 정보에 대한 경계심이 공존하고 있습니다.
탈숙련화(Deskilling) 쇼크: Anthropic의 경제 보고서가 언급되며, 에이전틱 AI의 보편화로 인한 전문직 숙련도 변화에 대비해야 한다는 시각이 대두되었습니다.

⚠️ 주의사항, 이슈 & 피해야 할 것들

사칭 스캠 주의: deepseekv4.online 사이트나 deepseek930@gmail.com과 같은 연락처는 DeepSeek v4를 사칭한 스캠일 가능성이 매우 높으므로 주의가 필요합니다.
계정 공유 리스크: G2G 등에서 저렴하게 판매되는 공유 계정(Shared accounts)은 도난 카드 기반일 확률이 높으며, 영구 정지 처분을 받을 위험이 큽니다.
Claude Slop: Claude 특유의 “You’re absolutely right” 식의 지나친 긍정 및 정형화된 문체(Slop)가 모델의 창의성을 저해한다는 비판이 있으므로, 커스텀 인스트럭션을 통해 이를 억제할 필요가 있습니다.

🔗 공유된 링크 & 리소스

모델 저장소: Hugging Face - GLM-4.7-Flash
비디오 벤치마크: Design Arena Video Leaderboard
논문: Visual Perception Benchmark (BabyVision)
신규 모델 뉴스: Z.ai (Zhipu AI) 블로그

📌 실행 가능한 핵심 사항

로컬 개발 환경 최적화: Mac 사용자라면 현재 사용하는 로컬 LLM을 CoreML로 변환하여 추론 속도를 극대화하는 작업을 우선 고려하십시오.
CLI 에이전트 튜닝: Claude Code나 Opencode 사용 시, 기본 설정에 의존하지 말고 Anthropic 가이드라인에 맞춘 시스템 프롬프트로 교체하여 도구 호출 성능을 개선하십시오.
Gemini 3 테스트: AI Studio에서 진행 중인 A/B 테스트에 참여하여 신규 체크포인트의 비전 인식 능력이 본인의 워크플로우(예: 데이터 추출, UI 디자인)에 적합한지 확인하십시오.
스캠 확인 절차 수립: 새로운 모델 출시 뉴스 접 시 공식 도메인(z.ai, deepseek.com 등)인지 반드시 확인하고, 비공식 메일이나 결제 링크를 클릭하지 마십시오.