AI 최신 뉴스 — 2026.03.04

Gemini Grok OpenAI Claude

🤖 AI 최신 뉴스
Gemini · Grok · OpenAI 대격돌

2026년 3월 첫째 주, AI 업계를 뒤흔든 4가지 업데이트와 손상현님의 실전 모델 활용법을 담았습니다.

2026 · 03 · 04

① Gemini 3.1 ② Grok 4.20 ③ GPT 5.3 ④ GPT 5.4 루머 💬 Q&A

AI 뉴스 — 2026.03.04

이번 주 AI 핵심 업데이트

비개발자도 이해할 수 있도록 풀어서 정리했습니다. 파란 밑줄 용어 위에 마우스를 올려보세요!

🔵 Google Gemini

2026.03.03 출시

Gemini 3.1 Flash-Lite 업데이트

구글이 Gemini 3.1 Flash-Lite 모델을 전격 업데이트했습니다. 이번 업데이트의 핵심은 '속도'와 '접근성'입니다.

핵심 설정에서 '빠른 모드(Fast Mode)'를 선택하면 기본 엔진이 3.1 Flash로 전환됩니다. 복잡한 추론보다 즉각적인 응답이 필요한 작업에서 압도적인 성능을 발휘합니다.

보완 특히 모바일 환경스마트폰·태블릿 기기에서의 사용 환경. 데스크탑보다 배터리와 처리 속도에 제약이 큽니다. 최적화가 진행되어, 이전 3.0 대비 에너지 효율이 15% 향상되었습니다.

📸 추천 이미지/영상

Gemini 설정 창에서 'Fast Mode' 스위치를 켜는 UI 캡처 화면
3.0 모델과 3.1 Flash-Lite의 응답 속도를 나란히 비교하는 영상

⚡ xAI Grok

2026.03.02 출시

Grok 4.20: AI 영상의 한계를 깨는 '롱테이크' 기능

xAI의 Grok 4.20 업데이트와 함께 '영상 연장(Video Extension)' 기능이 추가되었습니다.

핵심 생성된 짧은 쇼츠 영상보통 15~60초 이내의 짧은 세로형 영상. YouTube Shorts, Instagram Reels 등이 대표적입니다.의 마지막 프레임을 인식해 자연스럽게 뒤 내용을 이어 붙여줍니다.

보완 기존에는 긴 영상을 위해 '잘라 붙이기' 편집이 필수였으나, 이제 프레임 간 조명·캐릭터 위치·움직임의 방향성을 AI가 유지하며 생성합니다. 편집 피로도가 획기적으로 줄어듭니다.

📸 추천 이미지/영상

6초짜리 원본이 15초 이상의 시네마틱 영상으로 확장되는 비포/애프터 비교 영상
'Extend from Frame' 버튼이 활성화된 Grok Imagine UI 캡처

🟢 OpenAI

2026.03.03 출시

GPT 5.3 Instant 출시 — 환각 27% 감소

OpenAI가 GPT 5.3 Instant를 ChatGPT의 기본 모델로 출시했습니다.

핵심 웹 검색 기능을 결합했을 때 환각(Hallucination)AI가 사실이 아닌 내용을 자신있게 말하는 현상. 예: 존재하지 않는 논문을 인용하거나, 날짜를 잘못 말하는 경우. 현상이 약 26.8% (≈ 27%) 감소했습니다. 의료·법률·금융 분야 정확도가 크게 개선되었습니다.

보완 이전 5.2 모델의 '설교조(Preachy)' 말투와 불필요한 거절(Refusal) 현상을 대폭 수정해 훨씬 자연스럽고 유용한 답변을 제공합니다.

📸 추천 이미지/영상

5.2 vs 5.3 모델의 환각률 비교 그래프 (High-stakes domains 기준)
딱딱한 말투와 5.3의 개선된 말투를 비교하는 텍스트 대조 이미지

🔶 루머

2026.03.01–02 포착

GPT 5.4 출시 루머 — 이번 달 안으로?

개발자 커뮤니티와 GitHub 코드 유출을 통해 GPT 5.4에 대한 소문이 뜨겁습니다.

핵심 3월 1~2일경 OpenAI의 Codex 리포지토리GitHub에 올려진 소스코드 저장소. Codex는 OpenAI가 개발한 코딩 특화 AI 시스템입니다.에서 'GPT-5.4 Fast mode' 관련 코드가 포착되었습니다.

보완 전문가들은 오는 3월 25일 ARC-AGI-3 이벤트에서 샘 알트먼이 GPT 5.4를 깜짝 공개할 가능성이 높다고 봅니다.

📸 추천 이미지/영상

GitHub에서 유출된 'GPT-5.4' 관련 코드 라인 캡처 (블러 처리)
3월 25일 달력에 'GPT 5.4?' 메모가 적힌 예고성 이미지

독자 Q&A

💬 실전 AI 모델 활용법

커뮤니티 질문에 손상현님이 직접 답해주셨습니다. 질문자: 이태극

이태극 · 질문

Gemini, ChatGPT, Claude, Grok 모델이 여러 가지인데 각각 어떤 용도로 쓰세요?

이전의 Gemini Flash는 답변이 많이 아쉬웠는데, 업데이트 이후로는 어떨지 궁금하네요.

손상현 · 답변

모델마다 역할이 확실히 나뉘어 있어요. 아래처럼 정리할 수 있습니다.

🔵 Gemini

나노바나나2손상현님이 운영하는 자동화·AI 도구 채널/커뮤니티. Gemini 기반 이미지 생성 워크플로우를 공유합니다.를 통해 이미지 생성·수정을 압도적으로 많이 사용. 구글 챗봇의 딥리서치 기능과 NotebookLM도 자주 활용.

🟢 ChatGPT

GPT 5.2 — 대화·일정 관리용.
Codex 5.3 — 방대한 코드 리팩토링용. 가성비 + 헛도는 느낌이 가장 적음.

🟣 Claude

Sonnet 4.6 Computer Use — 복잡한 자동화 운영.
Opus 4.6 — 개발 메인 에이전트 모델. 가장 많이 사용.

⚡ Grok

Grok 4.2 웹서치 + 슈퍼헤비 모델 활용. Perplexity에 Gemini 3.1 탑재 후 사용량 현저히 감소. API 정보 수집이 주요 강점.

특히 Claude가 메인이고, 아래 워크플로우로 개발합니다:

🧠

Opus 4.6

큰 틀 기획·플랜 작성
(토큰 많이 사용)

→

⚙️

Sonnet 4.6

세부 플랜 작업 진행

→

✅

Codex

전체 코드 최적화·
컴팩트 진행

이태극 · 후속 질문

① Gemini로 이미지 생성하실 때 빠른 모드로 두고 쓰시는 편인가요?

② Codex로 컴팩트 진행한다고 하셨는데, 이건 뭘까요?

③ Perplexity에서 검색 모델을 Gemini 3.1 Pro로 하는 게 좋나요?

손상현 · 답변

Gemini 이미지 생성 모드

공식 출시 전에는 Pro 모드로 사용했지만, 출시 이후에는 빠른 모드를 씁니다. 이미지 생성에 시간이 꽤 걸리기 때문에 최대한 빠르게 여러 장을 뽑아서 합성하는 방식을 자주 사용해요. Lovart나 외부 이미지 생성 서비스를 쓰면 더 편리하기도 합니다.

Codex 컴팩트란?

개발 중인 GitHub 레포지토리의 복잡한 코드를 최적화하는 작업입니다. Codex로 전체 코드를 정리·컴팩트하게 다듬고 나서 다음 작업을 이어나가는 방식입니다.

Perplexity + Gemini 3.1

취향 차이지만 현재 AI 모델 중 환각 벤치마크 수치가 낮아서 자주 사용하고 있습니다. 정보 정확도가 중요한 리서치 작업에 특히 유용합니다.

출처

References

[1] TechInAsia (2026.03.03) — Google releases Gemini 3.1 Flash-Lite for mobile optimization.

[2] AdwaitX (2026.03.02) — Grok Imagine: Seamless video continuity with frame extension.

[3] OpenAI Blog (2026.03.03) — Introducing GPT-5.3 Instant: Accuracy and Tone Refinement.

[4] Chosun.com (2026.03.04) — OpenAI's 27% Hallucination Reduction: A breakthrough in professional AI.

[5] Zamin.uz / Reddit AI (2026.03.02) — Codex Leak: GPT-5.4 references spotted ahead of March event.