Gemini Omni: Google의 차세대 AI 비디오 생성기

네이티브 공간 오디오, 장면 단위 일관성, 채팅 기반 편집으로 시네마틱 클립을 생성하세요. Gemini Omni는 단 하나의 프롬프트를 완성된 샷으로 바꿔 줍니다.

Gemini Omni용 레퍼런스 프레임 업로드

Gemini Omni가 애니메이션화하기를 원하는 스틸 이미지를 드롭해 주세요. 모델은 캐릭터 정체성, 조명, 색감에 레퍼런스를 활용해 생성된 모션이 원본에 충실하도록 유지합니다. PNG 또는 JPG, 인물 사진과 제품 사진이 가장 잘 작동합니다.

PNG, JPG, WebP를 최대 24MB까지 지원

화면 비율 선택

시네마틱 재생용 16:9, 세로형 릴용 9:16, 소셜 스퀘어용 1:1. Gemini Omni는 크롭이 아니라 원본 그대로 올바른 프레이밍으로 렌더링합니다.

Gemini Omni 레퍼런스 프레임 및 완성된 비디오 프레임 1

모든 렌더링에 기본 탑재된 네이티브 오디오

Gemini Omni는 영상과 사운드를 하나의 신호로 작성하는 Google 최초의 비디오 모델입니다. 노면에 떨어지는 비를 요청하면 물보라가 발걸음과 박자가 맞고, 첼로를 요청하면 그 공간에 맞는 정확한 잔향이 따라옵니다. 2차 작업도, 폴리 에디터도, 수동 싱크도 필요 없습니다.

Prompt

Person walking through puddles in heavy rain, footsteps synchronized with splashing sounds, raindrops hitting umbrella in rhythm with audio, 4K quality, realistic water physics, cinematic atmosphere.

네이티브 공간 오디오

단 하나의 프롬프트로 만드는 시네마틱 룩

카메라 무빙, 렌즈 선택, 컬러 그레이딩은 1급 입력값입니다. Gemini Omni는 'shallow depth of field'를 진짜 DOF로, 'film noir'를 진짜 팔레트로, 'neon reflecting on wet pavement'를 실제 광원으로 해석합니다. 적어 둔 그대로의 촬영 감독 용어가 작동합니다.

Prompt

Professional portrait of a young man in a rainy urban street at night, neon signs reflecting on wet pavement, atmospheric fog, shallow depth of field, cinematic bokeh, moody color palette, 4K ultra-detailed, film noir aesthetic.

시네마틱 프롬프트 충실도

진짜 립싱크가 살아 있는 토킹 헤드

음성이 영상과 함께 생성되므로, 입 모양이 음소와 프레임 단위로 일치합니다. AI 비디오를 프리롤 광고, 설명용 릴, 더빙 없는 제품 데모에 마침내 투입할 수 있게 해 주는 기능입니다. Gemini Omni는 발음, 호흡, 그리고 사람 말 같은 작은 멈춤까지 다룹니다.

Prompt

Close-up shot of a woman speaking directly to camera, clear articulation of words, natural facial expressions during speech, perfect lip-sync with audio, 4K cinematic quality, professional interview lighting, authentic conversational tone.

신뢰할 수 있는 립싱크

신뢰할 수 있는 물리 기반 모션

천이 접히고, 물이 고이고, 머리카락이 가라앉습니다. Gemini Omni는 중력과 바람 아래서 물질이 어떻게 움직이는지에 대한 실제 내부 모델을 갖고 있어, 슬로우 모션 샷이 2026년에도 다른 모델이 만들어 내는 변형 아티팩트로 무너지지 않고 모든 프레임에서 일관되게 유지됩니다.

Prompt

Slow-motion shot of a red silk scarf being thrown into the air, floating gracefully with realistic fabric physics, gentle wind affecting movement, 4K quality, cinematic lighting with soft shadows, photorealistic material properties.

실제 같은 직물 물리

사진처럼 사실적인 액체와 굴절

액체는 오래도록 가짜 렌더링을 들통내는 신호였습니다. Gemini Omni는 이것을 제대로 해냅니다. 표면 장력, 유리 굴절, 정점에서 잠시 멈추는 물방울, 그리고 물이 잦아들 때의 미세한 흔들림까지. 제품 디렉터는 첫 시도에서 쓸 만한 테이크를 얻습니다.

Prompt

4K close-up of water being poured into a crystal glass, realistic liquid physics with surface tension, light refraction through water and glass, dynamic splashing, photorealistic transparency and reflections, cinematic lighting.

사진처럼 사실적인 액체

롱 테이크 캐릭터 일관성

Gemini Omni는 클립 전체에 걸쳐 얼굴, 의상, 공간을 유지합니다. 50페이지 분량의 스크립트를 업로드하면 누가 무엇을 입고 있는지, 램프가 어디에 있는지, 바람이 어느 방향에서 오는지를 추적합니다. 동일한 아이디어가 멀티 샷 릴로도 확장됩니다. 첫 번째 샷에서 생성한 캐릭터가 여덟 번째 샷에서도 동일한 캐릭터입니다.

Prompt

Cinematic close-up portrait of a woman in soft window light, 10 seconds of natural micro-expressions, breath visible, identity locked across every frame, 4K editorial photography aesthetic, shallow depth of field.

10초 동안 유지되는 정체성

Gemini Omni가 다른 이유

Gemini Omni는 Gemini 멀티모달 백본 위에 구축되어 있어, 사운드, 모션, 언어를 하나의 시스템으로 이해합니다. 아래는 이전의 모든 Google 비디오 모델을 뛰어넘게 하는 기능들입니다.

Gemini Omni 요금제

사용한 만큼 결제하는 크레딧 팩, 또는 연간 약정으로 30% 할인. 크레딧은 Gemini Omni의 텍스트-투-비디오, 이미지-투-비디오, 채팅 기반 리믹스 전반에서 1:1로 변환됩니다.

Starter
$9.9/ 월

Gemini Omni 시작하기.

포함 내역:

  • 월 2,950 크레딧
  • 월 약 30개의 짧은 렌더링
Creator
$19.9/ 월

현업 비디오 크리에이터를 위한 플랜.

포함 내역:

  • 월 6,500 크레딧
  • 월 약 70개의 짧은 렌더링
Studio
$49.9/ 월

에이전시와 스튜디오를 위한 플랜.

포함 내역:

  • 월 18,000 크레딧
  • 월 약 200개의 짧은 렌더링

Gemini Omni FAQ

Gemini Omni가 지금 무엇을 할 수 있는지, 그리고 워크플로우가 편집 도구와 어떻게 맞물리는지에 대한 실용적인 질문들.

01

Gemini Omni란 무엇인가요?

Gemini Omni는 I/O 2026에 앞서 Gemini 앱 내에서 모습을 드러낸 Google의 새로운 멀티모달 비디오 생성 모델입니다. 영상과 동기화된 공간 오디오를 한 번에 생성하고, 매우 긴 스크립트 컨텍스트를 받아들이며, 타임라인 스크러빙 대신 채팅으로 결과를 편집할 수 있게 해 줍니다.

02

Gemini Omni가 정말로 영상과 함께 오디오를 생성하나요?

예, 그것이 바로 핵심 변화입니다. 이전 Google 비디오 모델들은 별도의 오디오 패스가 필요했습니다. Gemini Omni는 단일 멀티모달 출력을 내보냅니다. 발걸음은 물보라 프레임에 정확히 떨어지고, 대사는 입 모양과 맞으며, 공간감 있는 룸 톤은 장면과 일치합니다.

03

채팅 기반 편집은 어떻게 작동하나요?

클립을 생성한 다음 원하는 변경 사항을 설명하면 됩니다. '워터마크 제거', '테이블 위 물건 교체', '대사 한 줄을 좀 더 부드럽게'. Gemini Omni는 영향을 받는 프레임만 다시 작성하고, 샷의 나머지는 픽셀 단위로 안정적으로 유지합니다.

04

Gemini Omni가 만드는 클립의 길이는 얼마나 되나요?

유출된 UI는 기본적으로 짧은 길이(몇 초)를 시사하고, 더 긴 테이크로의 장면 확장이 가능합니다. 확장된 테이크 전반에 걸쳐 캐릭터와 의상의 일관성이 유지되며, 편집용 작업에서는 단순한 길이보다 이쪽이 더 중요합니다.

05

출력물을 상업적으로 사용할 수 있나요?

생성한 출력물은 Google의 기반 모델 약관과 초상권, 음악, 상표권에 관한 현지 법률의 적용을 받으며, 사용자가 자유롭게 활용할 수 있습니다. 본 플랫폼은 Gemini Omni로 만든 비디오에 대한 권리를 주장하지 않습니다.