Nová hierarchia modelov v ChatGPT
Používatelia majú teraz v rozhraní k dispozícii nové delenie, ktoré umožňuje presne škálovať potrebný výkon:
- Thinking 5.4 (dlhšie premýšľanie): Štandard pre profesionálne zadania. Model využíva proces vnútornej verifikácie a plánovania pred samotným generovaním odpovede.
- Pro 5.4 (inteligencia na úrovni výskumníka): Najvýkonnejšia verzia určená pre používateľov, ktorí vyžadujú maximum pri extrémne komplexných vedeckých alebo dátových úlohách.
- Auto: Režim, ktorý sám vyhodnotí náročnosť promptu a pridelí mu potrebný čas na premýšľanie.
- Instant 5.3: Optimalizovaný pre rýchlosť pri úlohách, ktoré nevyžadujú hlbokú logickú analýzu.
GPT 5.4 spája pokroky v uvažovaní, kódovaní a agentických workflow do jedného modelu a je navrhnutý tak, aby zvládal komplexné pracovné úlohy presnejšie, efektívnejšie a s menším množstvom dodatočných inštrukcií. Pozrite si jeho kľúčové vlastnosti nižšie.
Programovanie
Jednou z výrazných noviniek je integrácia GPT 5.4 do prostredia Codex. Model podporuje až 1 milión tokenov kontextu, čo mu umožňuje plánovať, vykonávať a overovať úlohy na oveľa dlhšom horizonte než doteraz. Pri práci s veľkými kódovými základňami to znamená, že dokáže efektívnejšie pracovať naprieč rozsiahlymi repozitármi a zvládať dlhšie workflow bez straty kontextu.
OpenAI zároveň uvádza, že pri zapnutom režime /fast v Codexe prináša GPT 5.4 až 1,5-násobne vyššiu rýchlosť tokenovej odozvy. V praxi to znamená rýchlejšie iterácie, debugovanie aj plynulejší vývoj.
Autonómne ovládanie počítača (CUA)
OpenAI označuje 5.4 za prvý general-purpose model s natívnymi schopnosťami computer use. To znamená, že vie pracovať s počítačovým rozhraním, reagovať na screenshoty, používať myš a klávesnicu a vykonávať úlohy naprieč webmi a softvérovými systémami.
Model je silný aj pri vizuálnom chápaní rozhraní. Vie interpretovať screenshoty prehliadača alebo aplikácií a vykonávať konkrétne akcie podľa zadania. Tým sa otvára priestor pre agentov, ktorí dokážu riešiť reálne úlohy vo viacerých aplikáciách bez toho, aby používateľ musel každý krok riadiť manuálne.
Vylepšené vyhľadávanie na webe
GPT 5.4 zlepšuje aj prácu s webovým vyhľadávaním. OpenAI priamo uvádza, že GPT 5.4 Thinking zlepšuje deep web research, najmä pri veľmi špecifických otázkach, a zároveň lepšie udržiava kontext pri zadaniach, ktoré vyžadujú dlhšie premýšľanie.
Nejde teda len o rýchle vyhľadanie jednej odpovede, ale o kvalitnejšiu prácu pri rešeršoch, kde treba prechádzať viac zdrojov, porovnávať informácie a držať sa zadania aj pri dlhšom postupe. Na benchmarku BrowseComp dosiahol GPT 5.4 skóre 82,7 %, čo je výrazné zlepšenie oproti predchádzajúcim modelom.
Možnosť interakcie počas uvažovania
Jednou z praktických noviniek v ChatGPT je aj spôsob, akým GPT 5.4 Thinking pracuje počas odpovede. Model vie pri dlhších a zložitejších zadaniach ponúknuť vopred plán svojho postupu. Používateľ tak lepšie vidí, akým smerom sa model uberá ešte pred finálnym výstupom.
Dôležité je, že tento smer sa dá priebežne korigovať. Počas toho, ako model pracuje na odpovedi, mu môžete spresniť zadanie alebo ho nasmerovať inam. Výsledkom by mal byť výstup, ktorý skutočne potrebujete s menším dopromptovaním.
Bezpečnosť
Keďže GPT 5.4 prináša aj natívne schopnosti ovládania počítača, OpenAI výrazne riešilo aj bezpečnostnú vrstvu. Model je podľa firmy steerable cez developer messages, čo znamená, že jeho správanie možno nastavovať podľa konkrétneho použitia. Vývojári môžu zároveň definovať vlastné pravidlá, pri ktorých má model určité kroky potvrdiť, a tým prispôsobiť jeho správanie rôznej úrovni rizika.
Na fórach ako Reddit sa však objavujú aj správy o bezpečnostných zlyhaniach. No jedným dychom musíme dodať, že sa týkajú raw modelu bez systémových promptov (tzv. naked model). Red-teaming tímy (ako SPLX.ai) ukázali, že pri extrémne cielenom útoku na kontext model dokáže leaknuť dáta, ak nie je chránený externými filtrami.
Výsledky v benchmarkoch
Na GDPval, ktorý testuje schopnosť agentov vytvárať dobre špecifikovanú profesionálnu prácu naprieč 44 povolaniami, dosiahol GPT 5.4 výsledok 83,0 %.
Na SWE-Bench testoch dosiahol 58,1 %, čo je však len veľmi malé zlepšenie oproti predchádzajúcemu modelu.
Pri internom benchmarku zameranom na tabuľkové modelovanie dosiahol GPT 5.4 priemerné skóre 87,3 %.
OpenAI zároveň uvádza, že pri hodnotení prezentácií hodnotitelia, reálni ľudia, preferovali výstupy GPT 5.4 v 68 % prípadov oproti GPT 5.2, a to pre lepšiu estetiku, väčšiu vizuálnu variabilitu a efektívnejšie využitie generovania obrázkov.
Je za tým už aj Peter Steinberger?
Sčasti asi áno… Tento model totiž nesie rukopis podobný Petrov Steinbergerovi, zakladateľovi populárneho open-source projektu OpenClaw.
Steinbergerov príchod do OpenAI, ktorý sa udial vo februári, bol jasným signálom, že začína éra skutočných, výkonných autonómnych agentov. Práve jeho skúsenosti s budovaním systémov, ktoré dokážu reálne niečo urobiť na počítači používateľa, sa priamo premietli do novej schopnosti Native Computer Use v modeli 5.4.
Prepojenie potvrdzuje aj vydanie verzie OpenClaw 3.7, ktorá ako prvá prináša plnú integráciu GPT 5.4 a umožňuje vývojárom využiť jeho veľký kontext a nové uvažovanie v praxi.
Peter Steinberger na margo nového modelu a jeho schopností uviedol:
„Model je teraz zjednotený a inteligentnejší prakticky v každom smere – od písania dokumentácie až po hlboké uvažovanie. Je to oveľa lepší všeobecný agent a celkovo je práca s ním omnoho prirodzenejšia.“
Aj keď GPT 5.4 neprináša výrazný revolučný posun, ako sme boli zvyknutí v škorších štádiách LLMs, novinky ako autonómne ovládanie počítača či integrácia do Codexu sú určite veľké vylepšenia tohto modelu z dielne OpenAI.


