Gemini Omni umožňuje:
- generovať video z textového promptu,
- upravovať existujúce videá cez chat,
- kombinovať text, obrázky, audio a video v jednom zadaní,
- meniť scénu, kameru, objekty alebo pozadie,
- vytvárať konzistentné postavy naprieč scénami,
- generovať video aj so zvukom,
- upravovať výstup bez nutnosti začínať odznova.
Používateľ tak môže napríklad:
- nahrať krátke video,
- napísať – zmeň pozadie na podmorské mesto,
- následne pridať ďalší pokyn typu – pridaj tlmené osvetlenie a tiene,
- a model upraví scénu bez manuálneho editovania v klasickom video editore.
Gemini Omni Flash
Prvou verziou modelu je Gemini Omni Flash.
Google ho prezentuje ako rýchlejší model vhodný hlavne na:
- krátke videá,
- sociálne siete,
- storyboardy,
- reklamné kreatívy,
- rýchle prototypovanie obsahu.
Aktuálne generuje len 10 sekundové klipy, ale Google naznačil, že dĺžka videí sa bude postupne zvyšovať.
Kde je Gemini Omni dostupné
Google postupne integruje Gemini Omni do viacerých produktov:
- Gemini aplikácie,
- Google Flow,
- YouTube Shorts,
- YouTube Create.
Developer a enterprise prístup cez Vertex AI má prísť neskôr.
Koľko Gemini Omni stojí
Google zatiaľ nezverejnil samostatný API pricing pre Gemini Omni, no funkcionality sú dostupné v platených plánoch:
- Google AI Plus,
- Google AI Pro,
- Google AI Ultra.
Google zároveň na I/O 2026 oznámil zníženie ceny Ultra plánu na 100 USD mesačne.
Presné limity generovania videí podľa jednotlivých plánov zatiaľ neoznámil.
SynthID a označovanie AI videí
Google uvádza, že AI generované videá z Gemini Omni obsahujú SynthID watermarking, teda neviditeľné označenie AI obsahu.
Firma zároveň zatiaľ opatrnejšie pristupuje k niektorým realistickým video funkcionalitám kvôli deepfake rizikám.
Gemini Omni vs. Veo
Zaujímavé je, že Google postupne presúva video generation bližšie priamo pod Gemini ekosystém. To však neznamená, že Veo končí. Google naďalej ponúka aj samostatné Veo modely, pričom Gemini Omni funguje skôr ako multimodálna vrstva a workflow nad tvorbou obsahu.
Namiesto oddeleného video modelu chce mať Google jeden systém, ktorý:
- rozumie textu,
- analyzuje obraz,
- pracuje so zvukom,
- generuje video,
- a zároveň umožňuje editovanie cez chat.
Pre používateľov to znamená jednoduchší workflow bez nutnosti prepínať medzi viacerými AI nástrojmi alebo video editormi.
AI race nepoľavuje
Po náhlom ukončení Sory od OpenAI vzniká otázka, či Gemini Omni nebude pre časť používateľov ďalším dôvodom viac testovať nástroje z Google AI ekosystému. Najmä pri práci s videom, zvukom, editovaním a multimodálnymi vstupmi v jednom prostredí.
Zdroj videa: YouTube Google


